diff --git "a/experiment/rwkv-x-exp/v5-memory/actions-runner/_work/RWKV-infctx-trainer/RWKV-infctx-trainer/output/experiment/rwkv-x-exp/v5-memory/v5-L96-D1024-E1e-1-ctx4k-part3.ipynb" "b/experiment/rwkv-x-exp/v5-memory/actions-runner/_work/RWKV-infctx-trainer/RWKV-infctx-trainer/output/experiment/rwkv-x-exp/v5-memory/v5-L96-D1024-E1e-1-ctx4k-part3.ipynb"
deleted file mode 100644--- "a/experiment/rwkv-x-exp/v5-memory/actions-runner/_work/RWKV-infctx-trainer/RWKV-infctx-trainer/output/experiment/rwkv-x-exp/v5-memory/v5-L96-D1024-E1e-1-ctx4k-part3.ipynb"
+++ /dev/null
@@ -1,261885 +0,0 @@
-{
- "cells": [
-  {
-   "attachments": {},
-   "cell_type": "markdown",
-   "id": "ebe40958",
-   "metadata": {
-    "papermill": {
-     "duration": 0.003251,
-     "end_time": "2023-08-31T21:57:50.593195",
-     "exception": false,
-     "start_time": "2023-08-31T21:57:50.589944",
-     "status": "completed"
-    },
-    "tags": []
-   },
-   "source": [
-    "# RWKV v5 / embedding init-range 1e-01 / 4k\n",
-    "\n",
-    "- 96 layers\n",
-    "- 1024 embedding size\n",
-    "\n",
-    "Going through the modified memory training for v5 models, across various initial embedding model weights\n",
-    "\n",
-    "**Note:** This project assumes you have the rwkv-infctx conda env setup"
-   ]
-  },
-  {
-   "attachments": {},
-   "cell_type": "markdown",
-   "id": "ebb402ba",
-   "metadata": {
-    "papermill": {
-     "duration": 0.002118,
-     "end_time": "2023-08-31T21:57:50.597672",
-     "exception": false,
-     "start_time": "2023-08-31T21:57:50.595554",
-     "status": "completed"
-    },
-    "tags": []
-   },
-   "source": [
-    "# Basic Setup"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 1,
-   "id": "65508084",
-   "metadata": {
-    "execution": {
-     "iopub.execute_input": "2023-08-31T21:57:50.603240Z",
-     "iopub.status.busy": "2023-08-31T21:57:50.603055Z",
-     "iopub.status.idle": "2023-08-31T21:57:51.324018Z",
-     "shell.execute_reply": "2023-08-31T21:57:51.323016Z"
-    },
-    "papermill": {
-     "duration": 0.725665,
-     "end_time": "2023-08-31T21:57:51.325689",
-     "exception": false,
-     "start_time": "2023-08-31T21:57:50.600024",
-     "status": "completed"
-    },
-    "tags": []
-   },
-   "outputs": [],
-   "source": [
-    "# First lets setup the various directories, and init the model\n",
-    "!mkdir -p ../../../../model/\n",
-    "!mkdir -p ../../../../datapath/\n",
-    "!mkdir -p ../../../../checkpoint/"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 2,
-   "id": "4137a5b3",
-   "metadata": {
-    "execution": {
-     "iopub.execute_input": "2023-08-31T21:57:51.331628Z",
-     "iopub.status.busy": "2023-08-31T21:57:51.331434Z",
-     "iopub.status.idle": "2023-08-31T21:57:54.206520Z",
-     "shell.execute_reply": "2023-08-31T21:57:54.205777Z"
-    },
-    "papermill": {
-     "duration": 2.880097,
-     "end_time": "2023-08-31T21:57:54.208336",
-     "exception": false,
-     "start_time": "2023-08-31T21:57:51.328239",
-     "status": "completed"
-    },
-    "tags": []
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\u001b[33mWARNING: Running pip as the 'root' user can result in broken permissions and conflicting behaviour with the system package manager. It is recommended to use a virtual environment instead: https://pip.pypa.io/warnings/venv\u001b[0m\u001b[33m\r\n",
-      "\u001b[0m"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\u001b[1m[\u001b[0m\u001b[34;49mnotice\u001b[0m\u001b[1;39;49m]\u001b[0m\u001b[39;49m A new release of pip is available: \u001b[0m\u001b[31;49m23.1.2\u001b[0m\u001b[39;49m -> \u001b[0m\u001b[32;49m23.2.1\u001b[0m\r\n",
-      "\u001b[1m[\u001b[0m\u001b[34;49mnotice\u001b[0m\u001b[1;39;49m]\u001b[0m\u001b[39;49m To update, run: \u001b[0m\u001b[32;49mpython3.11 -m pip install --upgrade pip\u001b[0m\r\n"
-     ]
-    }
-   ],
-   "source": [
-    "# Additional dependencies for eval stuff\n",
-    "!pip install -q aiocsv aiofiles"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 3,
-   "id": "9db7327e",
-   "metadata": {
-    "execution": {
-     "iopub.execute_input": "2023-08-31T21:57:54.214815Z",
-     "iopub.status.busy": "2023-08-31T21:57:54.214569Z",
-     "iopub.status.idle": "2023-08-31T21:57:54.221053Z",
-     "shell.execute_reply": "2023-08-31T21:57:54.220407Z"
-    },
-    "papermill": {
-     "duration": 0.011029,
-     "end_time": "2023-08-31T21:57:54.222190",
-     "exception": false,
-     "start_time": "2023-08-31T21:57:54.211161",
-     "status": "completed"
-    },
-    "tags": []
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "DEEPSPEED_STRAT: deepspeed_stage_1\n",
-      "ENABLE_WANDB: True\n",
-      "GPU_DEVICES: auto\n",
-      "NOTEBOOK_DIR: /actions-runner/_work/RWKV-infctx-trainer/RWKV-infctx-trainer/notebook/experiment/rwkv-x-exp/v5-memory\n",
-      "INFERENCE_DIR: /actions-runner/_work/RWKV-infctx-trainer/RWKV-infctx-trainer/RWKV-v5\n",
-      "TRAINER_DIR: /actions-runner/_work/RWKV-infctx-trainer/RWKV-infctx-trainer/RWKV-v5\n",
-      "PROJECT_DIR: /actions-runner/_work/RWKV-infctx-trainer/RWKV-infctx-trainer\n"
-     ]
-    }
-   ],
-   "source": [
-    "DEEPSPEED_STRAT=\"deepspeed_stage_1\"\n",
-    "GPU_DEVICES=\"auto\"\n",
-    "ENABLE_WANDB=True\n",
-    "\n",
-    "# Layer count and embed dim to start with\n",
-    "LAYER_COUNT=96\n",
-    "EMBED_DIM=1024\n",
-    "\n",
-    "# Wavnet compatibility?\n",
-    "RWKV_WAVENET_LAYERS=0\n",
-    "\n",
-    "EMBED_SCALE=0.1\n",
-    "EMBED_SCALE_LABEL=str(EMBED_SCALE).replace(\".\", \"_\")\n",
-    "\n",
-    "WANDB_PREFIX=f\"v5-L{LAYER_COUNT}-D{EMBED_DIM}-E{EMBED_SCALE}\"\n",
-    "FILENAME_PREFIX=f\"v5-L{LAYER_COUNT}-D{EMBED_DIM}-E{EMBED_SCALE_LABEL}\"\n",
-    "\n",
-    "print(\"DEEPSPEED_STRAT:\", DEEPSPEED_STRAT)\n",
-    "print(\"ENABLE_WANDB:\", ENABLE_WANDB)\n",
-    "print(\"GPU_DEVICES:\", GPU_DEVICES)\n",
-    "\n",
-    "if ENABLE_WANDB:\n",
-    "    WANDB_MODE=\"online\"\n",
-    "else:\n",
-    "    WANDB_MODE=\"disabled\"\n",
-    "\n",
-    "# Computing the notebook, and various paths\n",
-    "import os\n",
-    "NOTEBOOK_DIR=os.path.dirname(os.path.abspath(\"__file__\"))\n",
-    "PROJECT_DIR=os.path.abspath(os.path.join(NOTEBOOK_DIR, \"../../../../\"))\n",
-    "TRAINER_DIR=os.path.abspath(os.path.join(PROJECT_DIR, \"./RWKV-v5/\"))\n",
-    "INFERENCE_DIR=os.path.abspath(os.path.join(PROJECT_DIR, \"./RWKV-v5/\"))\n",
-    "\n",
-    "print(\"NOTEBOOK_DIR:\", NOTEBOOK_DIR)\n",
-    "print(\"INFERENCE_DIR:\", INFERENCE_DIR)\n",
-    "print(\"TRAINER_DIR:\", TRAINER_DIR)\n",
-    "print(\"PROJECT_DIR:\", PROJECT_DIR)"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 4,
-   "id": "2c64df74",
-   "metadata": {
-    "execution": {
-     "iopub.execute_input": "2023-08-31T21:57:54.228179Z",
-     "iopub.status.busy": "2023-08-31T21:57:54.228014Z",
-     "iopub.status.idle": "2023-08-31T21:58:42.524078Z",
-     "shell.execute_reply": "2023-08-31T21:58:42.523147Z"
-    },
-    "papermill": {
-     "duration": 48.301166,
-     "end_time": "2023-08-31T21:58:42.526006",
-     "exception": false,
-     "start_time": "2023-08-31T21:57:54.224840",
-     "status": "completed"
-    },
-    "tags": []
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "--2023-08-31 21:57:54--  https://huggingface.co/rwkv-x-dev/rwkv-x-playground/resolve/main/experiment/rwkv-x-exp/v5-memory/v5-L96-D1024-E0_1-mem-ctx-512.pth\r\n",
-      "Resolving huggingface.co (huggingface.co)... "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "52.85.242.84, 52.85.242.16, 52.85.242.8, ...\r\n",
-      "Connecting to huggingface.co (huggingface.co)|52.85.242.84|:443... connected.\r\n",
-      "HTTP request sent, awaiting response... "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "302 Found\r\n",
-      "Location: https://cdn-lfs.huggingface.co/repos/2e/f7/2ef78555202aa92abdbdf476ce3d0fd5a8b15f7245edf0b80d4d30572355f30d/893167b0eb69142597da713f1d1a3b7c14cedbd34e677e45adc13979ae756e67?response-content-disposition=attachment%3B+filename*%3DUTF-8%27%27v5-L96-D1024-E0_1-mem-ctx-512.pth%3B+filename%3D%22v5-L96-D1024-E0_1-mem-ctx-512.pth%22%3B&Expires=1693778274&Policy=eyJTdGF0ZW1lbnQiOlt7IkNvbmRpdGlvbiI6eyJEYXRlTGVzc1RoYW4iOnsiQVdTOkVwb2NoVGltZSI6MTY5Mzc3ODI3NH19LCJSZXNvdXJjZSI6Imh0dHBzOi8vY2RuLWxmcy5odWdnaW5nZmFjZS5jby9yZXBvcy8yZS9mNy8yZWY3ODU1NTIwMmFhOTJhYmRiZGY0NzZjZTNkMGZkNWE4YjE1ZjcyNDVlZGYwYjgwZDRkMzA1NzIzNTVmMzBkLzg5MzE2N2IwZWI2OTE0MjU5N2RhNzEzZjFkMWEzYjdjMTRjZWRiZDM0ZTY3N2U0NWFkYzEzOTc5YWU3NTZlNjc%7EcmVzcG9uc2UtY29udGVudC1kaXNwb3NpdGlvbj0qIn1dfQ__&Signature=JD%7EsMmgqXtvAia5xWxOmrxJJ9tKU0Q3A1gQs41xamphNueZo1cxy07Gl%7ErYfrqYu2W8ERL%7E2h8HKUjyWDy1B7d6SNaLpMJs3t67q57-LfOTK11BsZUGYGii2HMl6tIMJQcChEHUfHujEOZ62QxNls0ETIL3U--Qn5%7E2AFAp1q5sMVngSNWSgN3X991uejYeR9tWVSFE1-iH%7E0h8TG4KjEhRYsjROpeLXkKExHKyz2vulh5gA6I103LDJdNTQ3y%7EXUGp6KRMlegIdpchJmoxoilnMOcHSWwyaY7Qf2veeYouQicgavUFrrJEMIMj-L%7EuJXlf%7EM24zwQ274ro5CJhvOA__&Key-Pair-Id=KVTP0A1DKRTAX [following]\r\n",
-      "--2023-08-31 21:57:54--  https://cdn-lfs.huggingface.co/repos/2e/f7/2ef78555202aa92abdbdf476ce3d0fd5a8b15f7245edf0b80d4d30572355f30d/893167b0eb69142597da713f1d1a3b7c14cedbd34e677e45adc13979ae756e67?response-content-disposition=attachment%3B+filename*%3DUTF-8%27%27v5-L96-D1024-E0_1-mem-ctx-512.pth%3B+filename%3D%22v5-L96-D1024-E0_1-mem-ctx-512.pth%22%3B&Expires=1693778274&Policy=eyJTdGF0ZW1lbnQiOlt7IkNvbmRpdGlvbiI6eyJEYXRlTGVzc1RoYW4iOnsiQVdTOkVwb2NoVGltZSI6MTY5Mzc3ODI3NH19LCJSZXNvdXJjZSI6Imh0dHBzOi8vY2RuLWxmcy5odWdnaW5nZmFjZS5jby9yZXBvcy8yZS9mNy8yZWY3ODU1NTIwMmFhOTJhYmRiZGY0NzZjZTNkMGZkNWE4YjE1ZjcyNDVlZGYwYjgwZDRkMzA1NzIzNTVmMzBkLzg5MzE2N2IwZWI2OTE0MjU5N2RhNzEzZjFkMWEzYjdjMTRjZWRiZDM0ZTY3N2U0NWFkYzEzOTc5YWU3NTZlNjc%7EcmVzcG9uc2UtY29udGVudC1kaXNwb3NpdGlvbj0qIn1dfQ__&Signature=JD%7EsMmgqXtvAia5xWxOmrxJJ9tKU0Q3A1gQs41xamphNueZo1cxy07Gl%7ErYfrqYu2W8ERL%7E2h8HKUjyWDy1B7d6SNaLpMJs3t67q57-LfOTK11BsZUGYGii2HMl6tIMJQcChEHUfHujEOZ62QxNls0ETIL3U--Qn5%7E2AFAp1q5sMVngSNWSgN3X991uejYeR9tWVSFE1-iH%7E0h8TG4KjEhRYsjROpeLXkKExHKyz2vulh5gA6I103LDJdNTQ3y%7EXUGp6KRMlegIdpchJmoxoilnMOcHSWwyaY7Qf2veeYouQicgavUFrrJEMIMj-L%7EuJXlf%7EM24zwQ274ro5CJhvOA__&Key-Pair-Id=KVTP0A1DKRTAX\r\n",
-      "Resolving cdn-lfs.huggingface.co (cdn-lfs.huggingface.co)... "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "108.157.214.82, 108.157.214.31, 108.157.214.7, ...\r\n",
-      "Connecting to cdn-lfs.huggingface.co (cdn-lfs.huggingface.co)|108.157.214.82|:443... connected.\r\n",
-      "HTTP request sent, awaiting response... "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "200 OK\r\n",
-      "Length: 2825978627 (2.6G) [binary/octet-stream]\r\n",
-      "Saving to: ‘v5-L96-D1024-E0_1-mem-ctx-512.pth’\r\n",
-      "\r\n",
-      "\r",
-      "          v5-L96-D1   0%[                    ]       0  --.-KB/s               "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "         v5-L96-D10   0%[                    ]   3.83M  19.0MB/s               "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "        v5-L96-D102   0%[                    ]  10.72M  25.5MB/s               "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "       v5-L96-D1024   0%[                    ]  23.43M  36.5MB/s               "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "      v5-L96-D1024-   1%[                    ]  33.54M  39.8MB/s               "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "     v5-L96-D1024-E   1%[                    ]  45.80M  43.0MB/s               "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "    v5-L96-D1024-E0   2%[                    ]  59.71M  47.2MB/s               "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "   v5-L96-D1024-E0_   2%[                    ]  71.07M  48.5MB/s               "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "  v5-L96-D1024-E0_1   3%[                    ]  81.38M  48.8MB/s               "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      " v5-L96-D1024-E0_1-   3%[                    ]  95.36M  51.0MB/s               "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "v5-L96-D1024-E0_1-m   4%[                    ] 109.14M  52.7MB/s               "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "5-L96-D1024-E0_1-me   4%[                    ] 118.34M  52.1MB/s               "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-L96-D1024-E0_1-mem   4%[                    ] 133.63M  53.9MB/s               "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "L96-D1024-E0_1-mem-   5%[>                   ] 146.71M  54.7MB/s               "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "96-D1024-E0_1-mem-c   5%[>                   ] 159.46M  55.4MB/s               "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "6-D1024-E0_1-mem-ct   6%[>                   ] 168.00M  54.5MB/s    eta 46s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-D1024-E0_1-mem-ctx   6%[>                   ] 181.76M  55.4MB/s    eta 46s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "D1024-E0_1-mem-ctx-   7%[>                   ] 191.94M  57.9MB/s    eta 46s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "1024-E0_1-mem-ctx-5   7%[>                   ] 204.83M  59.0MB/s    eta 46s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "024-E0_1-mem-ctx-51   8%[>                   ] 216.37M  59.2MB/s    eta 46s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "24-E0_1-mem-ctx-512   8%[>                   ] 228.26M  60.0MB/s    eta 44s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "4-E0_1-mem-ctx-512.   9%[>                   ] 242.89M  61.0MB/s    eta 44s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-E0_1-mem-ctx-512.p   9%[>                   ] 253.08M  60.3MB/s    eta 44s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "E0_1-mem-ctx-512.pt   9%[>                   ] 265.75M  60.2MB/s    eta 44s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "0_1-mem-ctx-512.pth  10%[=>                  ] 276.96M  59.9MB/s    eta 44s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "_1-mem-ctx-512.pth   10%[=>                  ] 292.39M  61.5MB/s    eta 42s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "1-mem-ctx-512.pth    11%[=>                  ] 304.31M  60.8MB/s    eta 42s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-mem-ctx-512.pth     11%[=>                  ] 318.00M  61.6MB/s    eta 42s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "mem-ctx-512.pth      12%[=>                  ] 331.02M  60.8MB/s    eta 42s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "em-ctx-512.pth       12%[=>                  ] 345.48M  61.1MB/s    eta 42s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "m-ctx-512.pth        13%[=>                  ] 353.27M  59.9MB/s    eta 41s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-ctx-512.pth         13%[=>                  ] 366.94M  61.0MB/s    eta 41s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "ctx-512.pth          14%[=>                  ] 378.82M  60.9MB/s    eta 41s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "tx-512.pth           14%[=>                  ] 389.97M  60.7MB/s    eta 41s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "x-512.pth            14%[=>                  ] 403.29M  61.3MB/s    eta 41s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-512.pth             15%[==>                 ] 416.44M  61.0MB/s    eta 39s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "512.pth              15%[==>                 ] 428.14M  61.0MB/s    eta 39s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "12.pth               16%[==>                 ] 437.77M  60.5MB/s    eta 39s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "2.pth                16%[==>                 ] 449.14M  60.1MB/s    eta 39s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      ".pth                 17%[==>                 ] 463.27M  60.3MB/s    eta 39s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "pth                  17%[==>                 ] 476.37M  59.7MB/s    eta 38s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "th                   18%[==>                 ] 491.04M  59.9MB/s    eta 38s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "h                    18%[==>                 ] 505.26M  60.4MB/s    eta 38s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                     19%[==>                 ] 517.72M  59.2MB/s    eta 38s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                  v  19%[==>                 ] 527.85M  58.4MB/s    eta 38s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                 v5  20%[===>                ] 542.46M  60.4MB/s    eta 37s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                v5-  20%[===>                ] 553.68M  60.1MB/s    eta 37s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "               v5-L  20%[===>                ] 565.89M  59.8MB/s    eta 37s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "              v5-L9  21%[===>                ] 577.69M  59.5MB/s    eta 37s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "             v5-L96  21%[===>                ] 590.93M  59.3MB/s    eta 37s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "            v5-L96-  22%[===>                ] 606.10M  60.2MB/s    eta 35s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "           v5-L96-D  22%[===>                ] 610.08M  57.7MB/s    eta 35s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "          v5-L96-D1  22%[===>                ] 617.99M  56.4MB/s    eta 35s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "         v5-L96-D10  23%[===>                ] 633.58M  58.1MB/s    eta 35s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "        v5-L96-D102  24%[===>                ] 647.01M  59.0MB/s    eta 35s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "       v5-L96-D1024  24%[===>                ] 659.04M  58.7MB/s    eta 35s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "      v5-L96-D1024-  24%[===>                ] 668.97M  57.2MB/s    eta 35s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "     v5-L96-D1024-E  25%[====>               ] 684.61M  58.4MB/s    eta 35s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "    v5-L96-D1024-E0  25%[====>               ] 693.83M  57.5MB/s    eta 35s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "   v5-L96-D1024-E0_  26%[====>               ] 704.54M  56.6MB/s    eta 35s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "  v5-L96-D1024-E0_1  26%[====>               ] 719.90M  56.7MB/s    eta 34s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      " v5-L96-D1024-E0_1-  27%[====>               ] 731.53M  56.9MB/s    eta 34s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "v5-L96-D1024-E0_1-m  27%[====>               ] 744.29M  57.3MB/s    eta 34s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "5-L96-D1024-E0_1-me  28%[====>               ] 755.07M  56.1MB/s    eta 34s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-L96-D1024-E0_1-mem  28%[====>               ] 767.07M  56.2MB/s    eta 34s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "L96-D1024-E0_1-mem-  28%[====>               ] 777.22M  54.7MB/s    eta 33s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "96-D1024-E0_1-mem-c  29%[====>               ] 788.64M  55.0MB/s    eta 33s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "6-D1024-E0_1-mem-ct  29%[====>               ] 801.82M  59.0MB/s    eta 33s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-D1024-E0_1-mem-ctx  30%[=====>              ] 811.88M  57.4MB/s    eta 33s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "D1024-E0_1-mem-ctx-  30%[=====>              ] 824.06M  57.1MB/s    eta 33s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "1024-E0_1-mem-ctx-5  31%[=====>              ] 839.12M  56.6MB/s    eta 32s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "024-E0_1-mem-ctx-51  31%[=====>              ] 851.85M  57.1MB/s    eta 32s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "24-E0_1-mem-ctx-512  32%[=====>              ] 865.35M  56.9MB/s    eta 32s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "4-E0_1-mem-ctx-512.  32%[=====>              ] 877.59M  57.5MB/s    eta 32s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-E0_1-mem-ctx-512.p  32%[=====>              ] 889.21M  58.6MB/s    eta 32s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "E0_1-mem-ctx-512.pt  33%[=====>              ] 902.22M  58.3MB/s    eta 31s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "0_1-mem-ctx-512.pth  33%[=====>              ] 914.63M  58.6MB/s    eta 31s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "_1-mem-ctx-512.pth   34%[=====>              ] 926.11M  57.7MB/s    eta 31s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "1-mem-ctx-512.pth    34%[=====>              ] 939.43M  58.6MB/s    eta 31s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-mem-ctx-512.pth     35%[======>             ] 952.47M  59.3MB/s    eta 31s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "mem-ctx-512.pth      35%[======>             ] 964.43M  59.2MB/s    eta 30s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "em-ctx-512.pth       36%[======>             ] 977.88M  59.9MB/s    eta 30s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "m-ctx-512.pth        36%[======>             ] 988.32M  59.0MB/s    eta 30s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-ctx-512.pth         37%[======>             ]   1000M  59.3MB/s    eta 30s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "ctx-512.pth          37%[======>             ]   1013M  59.5MB/s    eta 30s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "tx-512.pth           38%[======>             ]   1.00G  58.7MB/s    eta 29s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "x-512.pth            38%[======>             ]   1.02G  60.1MB/s    eta 29s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-512.pth             39%[======>             ]   1.03G  59.6MB/s    eta 29s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "512.pth              39%[======>             ]   1.04G  58.8MB/s    eta 29s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "12.pth               39%[======>             ]   1.05G  59.1MB/s    eta 29s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "2.pth                40%[=======>            ]   1.06G  58.9MB/s    eta 28s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      ".pth                 40%[=======>            ]   1.07G  58.1MB/s    eta 28s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "pth                  41%[=======>            ]   1.08G  57.4MB/s    eta 28s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "th                   41%[=======>            ]   1.09G  57.7MB/s    eta 28s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "h                    41%[=======>            ]   1.10G  56.3MB/s    eta 28s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                     42%[=======>            ]   1.11G  55.3MB/s    eta 27s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                  v  42%[=======>            ]   1.12G  55.4MB/s    eta 27s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                 v5  43%[=======>            ]   1.14G  57.6MB/s    eta 27s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                v5-  43%[=======>            ]   1.16G  60.1MB/s    eta 27s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "               v5-L  44%[=======>            ]   1.17G  59.0MB/s    eta 27s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "              v5-L9  44%[=======>            ]   1.17G  55.0MB/s    eta 26s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "             v5-L96  44%[=======>            ]   1.17G  52.1MB/s    eta 26s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "            v5-L96-  45%[========>           ]   1.18G  51.4MB/s    eta 26s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "           v5-L96-D  45%[========>           ]   1.20G  51.9MB/s    eta 26s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "          v5-L96-D1  45%[========>           ]   1.21G  51.4MB/s    eta 26s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "         v5-L96-D10  46%[========>           ]   1.22G  51.7MB/s    eta 25s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "        v5-L96-D102  46%[========>           ]   1.24G  52.4MB/s    eta 25s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "       v5-L96-D1024  47%[========>           ]   1.24G  52.0MB/s    eta 25s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "      v5-L96-D1024-  47%[========>           ]   1.25G  51.5MB/s    eta 25s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "     v5-L96-D1024-E  47%[========>           ]   1.26G  51.0MB/s    eta 25s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "    v5-L96-D1024-E0  48%[========>           ]   1.27G  50.5MB/s    eta 25s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "   v5-L96-D1024-E0_  48%[========>           ]   1.28G  50.0MB/s    eta 25s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "  v5-L96-D1024-E0_1  48%[========>           ]   1.29G  49.4MB/s    eta 25s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      " v5-L96-D1024-E0_1-  49%[========>           ]   1.30G  46.8MB/s    eta 25s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "v5-L96-D1024-E0_1-m  49%[========>           ]   1.31G  47.6MB/s    eta 25s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "5-L96-D1024-E0_1-me  50%[=========>          ]   1.33G  48.1MB/s    eta 24s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-L96-D1024-E0_1-mem  50%[=========>          ]   1.34G  51.3MB/s    eta 24s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "L96-D1024-E0_1-mem-  51%[=========>          ]   1.35G  55.1MB/s    eta 24s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "96-D1024-E0_1-mem-c  51%[=========>          ]   1.36G  54.6MB/s    eta 24s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "6-D1024-E0_1-mem-ct  52%[=========>          ]   1.37G  54.9MB/s    eta 24s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-D1024-E0_1-mem-ctx  52%[=========>          ]   1.38G  55.9MB/s    eta 22s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "D1024-E0_1-mem-ctx-  53%[=========>          ]   1.40G  55.4MB/s    eta 22s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "1024-E0_1-mem-ctx-5  53%[=========>          ]   1.41G  55.2MB/s    eta 22s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "024-E0_1-mem-ctx-51  54%[=========>          ]   1.42G  56.7MB/s    eta 22s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "24-E0_1-mem-ctx-512  54%[=========>          ]   1.43G  56.5MB/s    eta 22s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "4-E0_1-mem-ctx-512.  54%[=========>          ]   1.45G  58.1MB/s    eta 21s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-E0_1-mem-ctx-512.p  55%[==========>         ]   1.46G  60.3MB/s    eta 21s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "E0_1-mem-ctx-512.pt  55%[==========>         ]   1.47G  60.6MB/s    eta 21s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "0_1-mem-ctx-512.pth  56%[==========>         ]   1.48G  61.2MB/s    eta 21s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "_1-mem-ctx-512.pth   56%[==========>         ]   1.50G  60.8MB/s    eta 21s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "1-mem-ctx-512.pth    57%[==========>         ]   1.51G  59.9MB/s    eta 20s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-mem-ctx-512.pth     57%[==========>         ]   1.52G  60.5MB/s    eta 20s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "mem-ctx-512.pth      58%[==========>         ]   1.53G  59.9MB/s    eta 20s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "em-ctx-512.pth       58%[==========>         ]   1.54G  59.8MB/s    eta 20s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "m-ctx-512.pth        59%[==========>         ]   1.55G  58.7MB/s    eta 20s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-ctx-512.pth         59%[==========>         ]   1.57G  58.1MB/s    eta 19s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "ctx-512.pth          60%[===========>        ]   1.58G  58.8MB/s    eta 19s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "tx-512.pth           60%[===========>        ]   1.59G  59.6MB/s    eta 19s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "x-512.pth            60%[===========>        ]   1.60G  59.0MB/s    eta 19s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-512.pth             61%[===========>        ]   1.62G  59.6MB/s    eta 19s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "512.pth              61%[===========>        ]   1.62G  59.3MB/s    eta 18s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "12.pth               62%[===========>        ]   1.64G  58.6MB/s    eta 18s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "2.pth                62%[===========>        ]   1.65G  58.9MB/s    eta 18s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      ".pth                 63%[===========>        ]   1.66G  59.5MB/s    eta 18s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "pth                  63%[===========>        ]   1.68G  58.7MB/s    eta 18s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "th                   64%[===========>        ]   1.69G  58.6MB/s    eta 17s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "h                    64%[===========>        ]   1.70G  58.8MB/s    eta 17s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                     64%[===========>        ]   1.71G  58.8MB/s    eta 17s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                  v  65%[============>       ]   1.72G  58.8MB/s    eta 17s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                 v5  65%[============>       ]   1.73G  57.7MB/s    eta 17s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                v5-  65%[============>       ]   1.74G  56.0MB/s    eta 16s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "               v5-L  66%[============>       ]   1.74G  52.9MB/s    eta 16s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "              v5-L9  66%[============>       ]   1.75G  52.5MB/s    eta 16s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "             v5-L96  66%[============>       ]   1.76G  51.7MB/s    eta 16s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "            v5-L96-  67%[============>       ]   1.77G  51.3MB/s    eta 16s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "           v5-L96-D  67%[============>       ]   1.79G  52.2MB/s    eta 15s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "          v5-L96-D1  68%[============>       ]   1.80G  53.0MB/s    eta 15s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "         v5-L96-D10  68%[============>       ]   1.81G  52.9MB/s    eta 15s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "        v5-L96-D102  69%[============>       ]   1.82G  51.3MB/s    eta 15s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "       v5-L96-D1024  69%[============>       ]   1.83G  51.5MB/s    eta 15s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "      v5-L96-D1024-  70%[=============>      ]   1.85G  52.3MB/s    eta 14s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "     v5-L96-D1024-E  70%[=============>      ]   1.86G  52.5MB/s    eta 14s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "    v5-L96-D1024-E0  71%[=============>      ]   1.87G  53.5MB/s    eta 14s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "   v5-L96-D1024-E0_  71%[=============>      ]   1.88G  53.6MB/s    eta 14s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "  v5-L96-D1024-E0_1  71%[=============>      ]   1.89G  53.4MB/s    eta 14s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      " v5-L96-D1024-E0_1-  72%[=============>      ]   1.90G  54.6MB/s    eta 13s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "v5-L96-D1024-E0_1-m  72%[=============>      ]   1.92G  58.0MB/s    eta 13s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "5-L96-D1024-E0_1-me  73%[=============>      ]   1.93G  58.7MB/s    eta 13s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-L96-D1024-E0_1-mem  73%[=============>      ]   1.94G  59.9MB/s    eta 13s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "L96-D1024-E0_1-mem-  74%[=============>      ]   1.95G  60.0MB/s    eta 13s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "96-D1024-E0_1-mem-c  74%[=============>      ]   1.96G  59.1MB/s    eta 12s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "6-D1024-E0_1-mem-ct  75%[==============>     ]   1.97G  58.7MB/s    eta 12s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-D1024-E0_1-mem-ctx  75%[==============>     ]   1.99G  58.8MB/s    eta 12s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "D1024-E0_1-mem-ctx-  75%[==============>     ]   2.00G  59.2MB/s    eta 12s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "1024-E0_1-mem-ctx-5  76%[==============>     ]   2.01G  60.0MB/s    eta 12s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "024-E0_1-mem-ctx-51  76%[==============>     ]   2.02G  59.3MB/s    eta 11s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "24-E0_1-mem-ctx-512  77%[==============>     ]   2.04G  60.0MB/s    eta 11s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "4-E0_1-mem-ctx-512.  77%[==============>     ]   2.05G  59.3MB/s    eta 11s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-E0_1-mem-ctx-512.p  78%[==============>     ]   2.06G  59.9MB/s    eta 11s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "E0_1-mem-ctx-512.pt  78%[==============>     ]   2.07G  59.6MB/s    eta 11s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "0_1-mem-ctx-512.pth  79%[==============>     ]   2.09G  61.7MB/s    eta 10s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "_1-mem-ctx-512.pth   79%[==============>     ]   2.10G  60.7MB/s    eta 10s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "1-mem-ctx-512.pth    80%[===============>    ]   2.11G  60.4MB/s    eta 10s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-mem-ctx-512.pth     80%[===============>    ]   2.12G  61.1MB/s    eta 10s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "mem-ctx-512.pth      81%[===============>    ]   2.13G  61.2MB/s    eta 10s    "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "em-ctx-512.pth       81%[===============>    ]   2.15G  61.6MB/s    eta 9s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "m-ctx-512.pth        82%[===============>    ]   2.16G  63.1MB/s    eta 9s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-ctx-512.pth         82%[===============>    ]   2.17G  62.5MB/s    eta 9s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "ctx-512.pth          82%[===============>    ]   2.18G  61.3MB/s    eta 9s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "tx-512.pth           83%[===============>    ]   2.19G  61.4MB/s    eta 9s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "x-512.pth            83%[===============>    ]   2.20G  60.9MB/s    eta 8s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-512.pth             84%[===============>    ]   2.22G  61.6MB/s    eta 8s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "512.pth              84%[===============>    ]   2.23G  61.2MB/s    eta 8s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "12.pth               85%[================>   ]   2.24G  61.4MB/s    eta 8s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "2.pth                85%[================>   ]   2.25G  61.3MB/s    eta 8s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      ".pth                 86%[================>   ]   2.27G  61.3MB/s    eta 6s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "pth                  86%[================>   ]   2.27G  59.1MB/s    eta 6s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "th                   86%[================>   ]   2.29G  60.4MB/s    eta 6s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "h                    87%[================>   ]   2.30G  58.9MB/s    eta 6s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                     87%[================>   ]   2.31G  58.9MB/s    eta 6s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                  v  88%[================>   ]   2.32G  59.2MB/s    eta 6s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                 v5  88%[================>   ]   2.33G  59.3MB/s    eta 6s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                v5-  88%[================>   ]   2.34G  57.1MB/s    eta 6s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "               v5-L  89%[================>   ]   2.35G  56.9MB/s    eta 6s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "              v5-L9  89%[================>   ]   2.37G  57.3MB/s    eta 6s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "             v5-L96  89%[================>   ]   2.37G  53.8MB/s    eta 5s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "            v5-L96-  90%[=================>  ]   2.38G  53.6MB/s    eta 5s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "           v5-L96-D  91%[=================>  ]   2.40G  54.2MB/s    eta 5s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "          v5-L96-D1  91%[=================>  ]   2.41G  54.8MB/s    eta 5s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "         v5-L96-D10  91%[=================>  ]   2.42G  54.3MB/s    eta 5s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "        v5-L96-D102  92%[=================>  ]   2.43G  54.2MB/s    eta 4s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "       v5-L96-D1024  92%[=================>  ]   2.44G  54.5MB/s    eta 4s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "      v5-L96-D1024-  93%[=================>  ]   2.46G  55.5MB/s    eta 4s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "     v5-L96-D1024-E  93%[=================>  ]   2.47G  57.0MB/s    eta 4s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "    v5-L96-D1024-E0  94%[=================>  ]   2.48G  55.0MB/s    eta 4s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "   v5-L96-D1024-E0_  94%[=================>  ]   2.49G  55.6MB/s    eta 3s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "  v5-L96-D1024-E0_1  95%[==================> ]   2.50G  55.3MB/s    eta 3s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      " v5-L96-D1024-E0_1-  95%[==================> ]   2.51G  56.0MB/s    eta 3s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "v5-L96-D1024-E0_1-m  96%[==================> ]   2.53G  57.0MB/s    eta 3s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "5-L96-D1024-E0_1-me  96%[==================> ]   2.53G  55.4MB/s    eta 3s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-L96-D1024-E0_1-mem  96%[==================> ]   2.54G  57.5MB/s    eta 2s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "L96-D1024-E0_1-mem-  97%[==================> ]   2.55G  58.3MB/s    eta 2s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "96-D1024-E0_1-mem-c  97%[==================> ]   2.56G  56.0MB/s    eta 2s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "6-D1024-E0_1-mem-ct  97%[==================> ]   2.57G  54.8MB/s    eta 2s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "-D1024-E0_1-mem-ctx  98%[==================> ]   2.58G  55.3MB/s    eta 2s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "D1024-E0_1-mem-ctx-  98%[==================> ]   2.60G  57.0MB/s    eta 1s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "1024-E0_1-mem-ctx-5  99%[==================> ]   2.61G  56.8MB/s    eta 1s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "024-E0_1-mem-ctx-51  99%[==================> ]   2.63G  57.4MB/s    eta 1s     "
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "v5-L96-D1024-E0_1-m 100%[===================>]   2.63G  56.8MB/s    in 47s     \r\n",
-      "\r\n",
-      "2023-08-31 21:58:42 (57.3 MB/s) - ‘v5-L96-D1024-E0_1-mem-ctx-512.pth’ saved [2825978627/2825978627]\r\n",
-      "\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "total 2.7G\r\n",
-      "drwxr-xr-x  2 root root   55 Aug 31 21:57 .\r\n",
-      "drwxr-xr-x 19 root root 4.0K Aug 31 21:57 ..\r\n",
-      "-rw-r--r--  1 root root 2.7G Aug 30 15:41 v5-L96-D1024-E0_1-mem-ctx-512.pth\r\n"
-     ]
-    }
-   ],
-   "source": [
-    "# Download the model directly (stop gap till HF sync issues is resolved)\n",
-    "!cd \"{TRAINER_DIR}\" && cd \"../model/\" && \\\n",
-    "    wget -nc \"https://huggingface.co/rwkv-x-dev/rwkv-x-playground/resolve/main/experiment/rwkv-x-exp/v5-memory/{FILENAME_PREFIX}-mem-ctx-512.pth\"\n",
-    "\n",
-    "!cd \"{TRAINER_DIR}\" && cd \"../model/\" && \\\n",
-    "    ls -alh ."
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "id": "08cbb280",
-   "metadata": {
-    "papermill": {
-     "duration": 0.0134,
-     "end_time": "2023-08-31T21:58:42.553999",
-     "exception": false,
-     "start_time": "2023-08-31T21:58:42.540599",
-     "status": "completed"
-    },
-    "tags": []
-   },
-   "source": [
-    "## Tune 3 : Low ctx size (1024), memory training\n",
-    "\n",
-    "- Tune 3: Low ctx size (1024), Scaling up !"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 5,
-   "id": "b56747ca",
-   "metadata": {
-    "execution": {
-     "iopub.execute_input": "2023-08-31T21:58:42.583027Z",
-     "iopub.status.busy": "2023-08-31T21:58:42.582816Z",
-     "iopub.status.idle": "2023-08-31T21:58:43.139180Z",
-     "shell.execute_reply": "2023-08-31T21:58:43.138323Z"
-    },
-    "papermill": {
-     "duration": 0.600143,
-     "end_time": "2023-08-31T21:58:43.167557",
-     "exception": false,
-     "start_time": "2023-08-31T21:58:42.567414",
-     "status": "completed"
-    },
-    "tags": []
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Generating word reptition dataset ##\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 2 max words, 400 samples - at ../dataset/word-2-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 5 max words, 400 samples - at ../dataset/gen-word-5-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 40 max words, 400 samples - at ../dataset/gen-word-40-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 15 max words, 400 samples - at ../dataset/gen-word-15-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 10 max words, 400 samples - at ../dataset/gen-word-10-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 652 samples (10 token repeat) - 40 max words - at ../dataset/shuffle-word-40-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 35 max words, 400 samples - at ../dataset/gen-word-35-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 590 samples (10 token repeat) - 45 max words - at ../dataset/shuffle-word-45-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 25 max words, 400 samples - at ../dataset/gen-word-25-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 1304 samples (10 token repeat) - 20 max words - at ../dataset/shuffle-word-20-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 55 max words, 800 samples - at ../dataset/gen-word-55-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 1062 samples (10 token repeat) - 25 max words - at ../dataset/shuffle-word-25-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 80 max words, 800 samples - at ../dataset/gen-word-80-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 1779 samples (10 token repeat) - 15 max words - at ../dataset/shuffle-word-15-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 2602 samples (10 token repeat) - 10 max words - at ../dataset/shuffle-word-10-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 877 samples (10 token repeat) - 30 max words - at ../dataset/shuffle-word-30-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 1056 samples (20 token repeat) - 50 max words - at ../dataset/shuffle-word-50-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 806 samples (20 token repeat) - 65 max words - at ../dataset/shuffle-word-65-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 60 max words, 800 samples - at ../dataset/gen-word-60-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 716 samples (20 token repeat) - 75 max words - at ../dataset/shuffle-word-75-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 50 max words, 800 samples - at ../dataset/gen-word-50-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 880 samples (20 token repeat) - 60 max words - at ../dataset/shuffle-word-60-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 948 samples (20 token repeat) - 55 max words - at ../dataset/shuffle-word-55-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 748 samples (20 token repeat) - 70 max words - at ../dataset/shuffle-word-70-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 380 samples (20 token repeat) - 115 max words - at ../dataset/shuffle-word-115-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 5578 samples (10 token repeat) - 5 max words - at ../dataset/shuffle-word-5-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 670 samples (20 token repeat) - 80 max words - at ../dataset/shuffle-word-80-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 65 max words, 800 samples - at ../dataset/gen-word-65-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 415 samples (20 token repeat) - 105 max words - at ../dataset/shuffle-word-105-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 30 max words, 400 samples - at ../dataset/gen-word-30-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 291 samples (20 token repeat) - 160 max words - at ../dataset/shuffle-word-160-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 345 samples (20 token repeat) - 130 max words - at ../dataset/shuffle-word-130-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 45 max words, 400 samples - at ../dataset/gen-word-45-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 20 max words, 400 samples - at ../dataset/gen-word-20-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 368 samples (20 token repeat) - 120 max words - at ../dataset/shuffle-word-120-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 564 samples (20 token repeat) - 95 max words - at ../dataset/shuffle-word-95-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 752 samples (10 token repeat) - 35 max words - at ../dataset/shuffle-word-35-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 537 samples (20 token repeat) - 100 max words - at ../dataset/shuffle-word-100-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 70 max words, 800 samples - at ../dataset/gen-word-70-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 358 samples (20 token repeat) - 125 max words - at ../dataset/shuffle-word-125-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 95 max words, 800 samples - at ../dataset/gen-word-95-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 105 max words, 800 samples - at ../dataset/gen-word-105-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 130 max words, 800 samples - at ../dataset/gen-word-130-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 85 max words, 800 samples - at ../dataset/gen-word-85-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 619 samples (20 token repeat) - 85 max words - at ../dataset/shuffle-word-85-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 203 samples (20 token repeat) - 215 max words - at ../dataset/shuffle-word-215-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 593 samples (20 token repeat) - 90 max words - at ../dataset/shuffle-word-90-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 100 max words, 800 samples - at ../dataset/gen-word-100-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 192 samples (20 token repeat) - 240 max words - at ../dataset/shuffle-word-240-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 141 samples (20 token repeat) - 395 max words - at ../dataset/shuffle-word-395-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 218 samples (20 token repeat) - 205 max words - at ../dataset/shuffle-word-205-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 208 samples (20 token repeat) - 210 max words - at ../dataset/shuffle-word-210-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 140 samples (20 token repeat) - 380 max words - at ../dataset/shuffle-word-380-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 117 samples (20 token repeat) - 430 max words - at ../dataset/shuffle-word-430-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 277 samples (20 token repeat) - 200 max words - at ../dataset/shuffle-word-200-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 125 max words, 800 samples - at ../dataset/gen-word-125-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 301 samples (20 token repeat) - 155 max words - at ../dataset/shuffle-word-155-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 197 samples (20 token repeat) - 235 max words - at ../dataset/shuffle-word-235-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 117 samples (20 token repeat) - 435 max words - at ../dataset/shuffle-word-435-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 180 max words, 800 samples - at ../dataset/gen-word-180-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 116 samples (20 token repeat) - 450 max words - at ../dataset/shuffle-word-450-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 120 samples (20 token repeat) - 420 max words - at ../dataset/shuffle-word-420-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 170 max words, 800 samples - at ../dataset/gen-word-170-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 139 samples (20 token repeat) - 370 max words - at ../dataset/shuffle-word-370-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 118 samples (20 token repeat) - 475 max words - at ../dataset/shuffle-word-475-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 140 samples (20 token repeat) - 390 max words - at ../dataset/shuffle-word-390-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 120 samples (20 token repeat) - 405 max words - at ../dataset/shuffle-word-405-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 510 max words - at ../dataset/shuffle-word-510-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 143 samples (20 token repeat) - 315 max words - at ../dataset/shuffle-word-315-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 142 samples (20 token repeat) - 320 max words - at ../dataset/shuffle-word-320-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 75 max words, 800 samples - at ../dataset/gen-word-75-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 118 samples (20 token repeat) - 485 max words - at ../dataset/shuffle-word-485-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 145 samples (20 token repeat) - 305 max words - at ../dataset/shuffle-word-305-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 115 samples (20 token repeat) - 465 max words - at ../dataset/shuffle-word-465-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 289 samples (20 token repeat) - 165 max words - at ../dataset/shuffle-word-165-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 540 max words - at ../dataset/shuffle-word-540-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 118 samples (20 token repeat) - 440 max words - at ../dataset/shuffle-word-440-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 140 samples (20 token repeat) - 335 max words - at ../dataset/shuffle-word-335-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 189 samples (20 token repeat) - 245 max words - at ../dataset/shuffle-word-245-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 200 samples (20 token repeat) - 225 max words - at ../dataset/shuffle-word-225-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 141 samples (20 token repeat) - 350 max words - at ../dataset/shuffle-word-350-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 515 max words - at ../dataset/shuffle-word-515-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 184 samples (20 token repeat) - 270 max words - at ../dataset/shuffle-word-270-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 90 max words, 800 samples - at ../dataset/gen-word-90-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 140 samples (20 token repeat) - 355 max words - at ../dataset/shuffle-word-355-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 278 samples (20 token repeat) - 180 max words - at ../dataset/shuffle-word-180-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 278 samples (20 token repeat) - 175 max words - at ../dataset/shuffle-word-175-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 145 max words, 800 samples - at ../dataset/gen-word-145-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 276 samples (20 token repeat) - 185 max words - at ../dataset/shuffle-word-185-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 143 samples (20 token repeat) - 400 max words - at ../dataset/shuffle-word-400-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 110 max words, 800 samples - at ../dataset/gen-word-110-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 287 samples (20 token repeat) - 170 max words - at ../dataset/shuffle-word-170-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 185 samples (20 token repeat) - 295 max words - at ../dataset/shuffle-word-295-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 141 samples (20 token repeat) - 345 max words - at ../dataset/shuffle-word-345-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 505 max words - at ../dataset/shuffle-word-505-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 145 samples (20 token repeat) - 325 max words - at ../dataset/shuffle-word-325-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 545 max words - at ../dataset/shuffle-word-545-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 118 samples (20 token repeat) - 425 max words - at ../dataset/shuffle-word-425-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 143 samples (20 token repeat) - 330 max words - at ../dataset/shuffle-word-330-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 200 samples (20 token repeat) - 220 max words - at ../dataset/shuffle-word-220-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 142 samples (20 token repeat) - 340 max words - at ../dataset/shuffle-word-340-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 520 max words - at ../dataset/shuffle-word-520-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 160 max words, 800 samples - at ../dataset/gen-word-160-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 398 samples (20 token repeat) - 110 max words - at ../dataset/shuffle-word-110-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 319 samples (20 token repeat) - 145 max words - at ../dataset/shuffle-word-145-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 188 samples (20 token repeat) - 250 max words - at ../dataset/shuffle-word-250-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 141 samples (20 token repeat) - 375 max words - at ../dataset/shuffle-word-375-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 99 samples (20 token repeat) - 535 max words - at ../dataset/shuffle-word-535-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 215 max words, 800 samples - at ../dataset/gen-word-215-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 189 samples (20 token repeat) - 255 max words - at ../dataset/shuffle-word-255-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 186 samples (20 token repeat) - 275 max words - at ../dataset/shuffle-word-275-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 186 samples (20 token repeat) - 290 max words - at ../dataset/shuffle-word-290-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 155 max words, 800 samples - at ../dataset/gen-word-155-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 530 max words - at ../dataset/shuffle-word-530-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 335 samples (20 token repeat) - 135 max words - at ../dataset/shuffle-word-135-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 117 samples (20 token repeat) - 445 max words - at ../dataset/shuffle-word-445-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 220 max words, 800 samples - at ../dataset/gen-word-220-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 305 samples (20 token repeat) - 150 max words - at ../dataset/shuffle-word-150-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 187 samples (20 token repeat) - 265 max words - at ../dataset/shuffle-word-265-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 200 samples (20 token repeat) - 230 max words - at ../dataset/shuffle-word-230-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 186 samples (20 token repeat) - 300 max words - at ../dataset/shuffle-word-300-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 225 max words, 800 samples - at ../dataset/gen-word-225-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 120 max words, 800 samples - at ../dataset/gen-word-120-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 270 samples (20 token repeat) - 195 max words - at ../dataset/shuffle-word-195-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 115 max words, 800 samples - at ../dataset/gen-word-115-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 140 samples (20 token repeat) - 360 max words - at ../dataset/shuffle-word-360-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 118 samples (20 token repeat) - 455 max words - at ../dataset/shuffle-word-455-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 274 samples (20 token repeat) - 190 max words - at ../dataset/shuffle-word-190-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 116 samples (20 token repeat) - 460 max words - at ../dataset/shuffle-word-460-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 183 samples (20 token repeat) - 280 max words - at ../dataset/shuffle-word-280-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 115 samples (20 token repeat) - 495 max words - at ../dataset/shuffle-word-495-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 180 samples (20 token repeat) - 285 max words - at ../dataset/shuffle-word-285-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 525 max words - at ../dataset/shuffle-word-525-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 120 samples (20 token repeat) - 415 max words - at ../dataset/shuffle-word-415-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 119 samples (20 token repeat) - 410 max words - at ../dataset/shuffle-word-410-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 140 max words, 800 samples - at ../dataset/gen-word-140-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 143 samples (20 token repeat) - 310 max words - at ../dataset/shuffle-word-310-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 324 samples (20 token repeat) - 140 max words - at ../dataset/shuffle-word-140-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 210 max words, 800 samples - at ../dataset/gen-word-210-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 205 max words, 800 samples - at ../dataset/gen-word-205-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 118 samples (20 token repeat) - 470 max words - at ../dataset/shuffle-word-470-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 250 max words, 800 samples - at ../dataset/gen-word-250-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 115 samples (20 token repeat) - 480 max words - at ../dataset/shuffle-word-480-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 140 samples (20 token repeat) - 385 max words - at ../dataset/shuffle-word-385-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 245 max words, 800 samples - at ../dataset/gen-word-245-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 165 max words, 800 samples - at ../dataset/gen-word-165-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 116 samples (20 token repeat) - 500 max words - at ../dataset/shuffle-word-500-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 115 samples (20 token repeat) - 490 max words - at ../dataset/shuffle-word-490-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 185 samples (20 token repeat) - 260 max words - at ../dataset/shuffle-word-260-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 150 max words, 800 samples - at ../dataset/gen-word-150-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 185 max words, 800 samples - at ../dataset/gen-word-185-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 135 max words, 800 samples - at ../dataset/gen-word-135-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 550 max words - at ../dataset/shuffle-word-550-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 200 max words, 800 samples - at ../dataset/gen-word-200-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 240 max words, 800 samples - at ../dataset/gen-word-240-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 143 samples (20 token repeat) - 365 max words - at ../dataset/shuffle-word-365-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 330 max words, 800 samples - at ../dataset/gen-word-330-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 255 max words, 800 samples - at ../dataset/gen-word-255-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 350 max words, 800 samples - at ../dataset/gen-word-350-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 290 max words, 800 samples - at ../dataset/gen-word-290-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 345 max words, 800 samples - at ../dataset/gen-word-345-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 190 max words, 800 samples - at ../dataset/gen-word-190-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 295 max words, 800 samples - at ../dataset/gen-word-295-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 320 max words, 800 samples - at ../dataset/gen-word-320-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 415 max words, 800 samples - at ../dataset/gen-word-415-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 230 max words, 800 samples - at ../dataset/gen-word-230-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 395 max words, 800 samples - at ../dataset/gen-word-395-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 260 max words, 800 samples - at ../dataset/gen-word-260-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 265 max words, 800 samples - at ../dataset/gen-word-265-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 275 max words, 800 samples - at ../dataset/gen-word-275-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 175 max words, 800 samples - at ../dataset/gen-word-175-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 355 max words, 800 samples - at ../dataset/gen-word-355-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 195 max words, 800 samples - at ../dataset/gen-word-195-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 270 max words, 800 samples - at ../dataset/gen-word-270-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 370 max words, 800 samples - at ../dataset/gen-word-370-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 285 max words, 800 samples - at ../dataset/gen-word-285-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 235 max words, 800 samples - at ../dataset/gen-word-235-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 505 max words, 800 samples - at ../dataset/gen-word-505-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 365 max words, 800 samples - at ../dataset/gen-word-365-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 450 max words, 800 samples - at ../dataset/gen-word-450-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 280 max words, 800 samples - at ../dataset/gen-word-280-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 315 max words, 800 samples - at ../dataset/gen-word-315-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 300 max words, 800 samples - at ../dataset/gen-word-300-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 305 max words, 800 samples - at ../dataset/gen-word-305-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 385 max words, 800 samples - at ../dataset/gen-word-385-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 430 max words, 800 samples - at ../dataset/gen-word-430-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 360 max words, 800 samples - at ../dataset/gen-word-360-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 525 max words, 800 samples - at ../dataset/gen-word-525-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 340 max words, 800 samples - at ../dataset/gen-word-340-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 405 max words, 800 samples - at ../dataset/gen-word-405-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 420 max words, 800 samples - at ../dataset/gen-word-420-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 390 max words, 800 samples - at ../dataset/gen-word-390-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 495 max words, 800 samples - at ../dataset/gen-word-495-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 500 max words, 800 samples - at ../dataset/gen-word-500-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 375 max words, 800 samples - at ../dataset/gen-word-375-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 325 max words, 800 samples - at ../dataset/gen-word-325-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 520 max words, 800 samples - at ../dataset/gen-word-520-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 310 max words, 800 samples - at ../dataset/gen-word-310-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 410 max words, 800 samples - at ../dataset/gen-word-410-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 380 max words, 800 samples - at ../dataset/gen-word-380-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 460 max words, 800 samples - at ../dataset/gen-word-460-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 400 max words, 800 samples - at ../dataset/gen-word-400-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 470 max words, 800 samples - at ../dataset/gen-word-470-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 335 max words, 800 samples - at ../dataset/gen-word-335-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 530 max words, 800 samples - at ../dataset/gen-word-530-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 540 max words, 800 samples - at ../dataset/gen-word-540-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 485 max words, 800 samples - at ../dataset/gen-word-485-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 550 max words, 800 samples - at ../dataset/gen-word-550-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 435 max words, 800 samples - at ../dataset/gen-word-435-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 425 max words, 800 samples - at ../dataset/gen-word-425-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 455 max words, 800 samples - at ../dataset/gen-word-455-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 465 max words, 800 samples - at ../dataset/gen-word-465-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 510 max words, 800 samples - at ../dataset/gen-word-510-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 490 max words, 800 samples - at ../dataset/gen-word-490-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 445 max words, 800 samples - at ../dataset/gen-word-445-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 545 max words, 800 samples - at ../dataset/gen-word-545-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 480 max words, 800 samples - at ../dataset/gen-word-480-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 440 max words, 800 samples - at ../dataset/gen-word-440-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 475 max words, 800 samples - at ../dataset/gen-word-475-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 515 max words, 800 samples - at ../dataset/gen-word-515-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 535 max words, 800 samples - at ../dataset/gen-word-535-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Done ##\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "total 297M\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "drwxr-xr-x  2 root root   12K Aug 31 21:58 .\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "drwxr-xr-x 14 root root   302 Aug 31 21:58 ..\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   78K Aug 31 21:58 gen-word-10-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  858K Aug 31 21:58 gen-word-100-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  895K Aug 31 21:58 gen-word-105-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  936K Aug 31 21:58 gen-word-110-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  968K Aug 31 21:58 gen-word-115-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root 1008K Aug 31 21:58 gen-word-120-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.1M Aug 31 21:58 gen-word-125-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.1M Aug 31 21:58 gen-word-130-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.2M Aug 31 21:58 gen-word-135-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.2M Aug 31 21:58 gen-word-140-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.2M Aug 31 21:58 gen-word-145-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   98K Aug 31 21:58 gen-word-15-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.3M Aug 31 21:58 gen-word-150-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.3M Aug 31 21:58 gen-word-155-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.3M Aug 31 21:58 gen-word-160-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.4M Aug 31 21:58 gen-word-165-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.4M Aug 31 21:58 gen-word-170-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.4M Aug 31 21:58 gen-word-175-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.5M Aug 31 21:58 gen-word-180-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.5M Aug 31 21:58 gen-word-185-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.6M Aug 31 21:58 gen-word-190-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.6M Aug 31 21:58 gen-word-195-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  118K Aug 31 21:58 gen-word-20-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.6M Aug 31 21:58 gen-word-200-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.7M Aug 31 21:58 gen-word-205-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.7M Aug 31 21:58 gen-word-210-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.7M Aug 31 21:58 gen-word-215-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.8M Aug 31 21:58 gen-word-220-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.8M Aug 31 21:58 gen-word-225-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.9M Aug 31 21:58 gen-word-230-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.9M Aug 31 21:58 gen-word-235-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.0M Aug 31 21:58 gen-word-240-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.0M Aug 31 21:58 gen-word-245-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  138K Aug 31 21:58 gen-word-25-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.0M Aug 31 21:58 gen-word-250-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.1M Aug 31 21:58 gen-word-255-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.1M Aug 31 21:58 gen-word-260-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.1M Aug 31 21:58 gen-word-265-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.2M Aug 31 21:58 gen-word-270-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.2M Aug 31 21:58 gen-word-275-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.2M Aug 31 21:58 gen-word-280-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.3M Aug 31 21:58 gen-word-285-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.3M Aug 31 21:58 gen-word-290-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.4M Aug 31 21:58 gen-word-295-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  156K Aug 31 21:58 gen-word-30-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.4M Aug 31 21:58 gen-word-300-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.5M Aug 31 21:58 gen-word-305-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.5M Aug 31 21:58 gen-word-310-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.5M Aug 31 21:58 gen-word-315-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.6M Aug 31 21:58 gen-word-320-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.6M Aug 31 21:58 gen-word-325-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.6M Aug 31 21:58 gen-word-330-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.7M Aug 31 21:58 gen-word-335-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.7M Aug 31 21:58 gen-word-340-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.7M Aug 31 21:58 gen-word-345-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  177K Aug 31 21:58 gen-word-35-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.8M Aug 31 21:58 gen-word-350-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.8M Aug 31 21:58 gen-word-355-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.9M Aug 31 21:58 gen-word-360-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.9M Aug 31 21:58 gen-word-365-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.9M Aug 31 21:58 gen-word-370-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.0M Aug 31 21:58 gen-word-375-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.0M Aug 31 21:58 gen-word-380-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.0M Aug 31 21:58 gen-word-385-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.1M Aug 31 21:58 gen-word-390-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.1M Aug 31 21:58 gen-word-395-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  196K Aug 31 21:58 gen-word-40-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.1M Aug 31 21:58 gen-word-400-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.2M Aug 31 21:58 gen-word-405-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.3M Aug 31 21:58 gen-word-410-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.3M Aug 31 21:58 gen-word-415-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.3M Aug 31 21:58 gen-word-420-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.3M Aug 31 21:58 gen-word-425-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.4M Aug 31 21:58 gen-word-430-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.4M Aug 31 21:58 gen-word-435-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.5M Aug 31 21:58 gen-word-440-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.5M Aug 31 21:58 gen-word-445-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  216K Aug 31 21:58 gen-word-45-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.5M Aug 31 21:58 gen-word-450-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.6M Aug 31 21:58 gen-word-455-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.6M Aug 31 21:58 gen-word-460-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.6M Aug 31 21:58 gen-word-465-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.7M Aug 31 21:58 gen-word-470-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.7M Aug 31 21:58 gen-word-475-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.8M Aug 31 21:58 gen-word-480-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.8M Aug 31 21:58 gen-word-485-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.8M Aug 31 21:58 gen-word-490-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.9M Aug 31 21:58 gen-word-495-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   59K Aug 31 21:58 gen-word-5-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  472K Aug 31 21:58 gen-word-50-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.9M Aug 31 21:58 gen-word-500-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  4.0M Aug 31 21:58 gen-word-505-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  4.0M Aug 31 21:58 gen-word-510-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  4.0M Aug 31 21:58 gen-word-515-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  4.1M Aug 31 21:58 gen-word-520-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  4.1M Aug 31 21:58 gen-word-525-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  4.2M Aug 31 21:58 gen-word-530-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  4.2M Aug 31 21:58 gen-word-535-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  4.2M Aug 31 21:58 gen-word-540-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  4.3M Aug 31 21:58 gen-word-545-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  509K Aug 31 21:58 gen-word-55-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  4.3M Aug 31 21:58 gen-word-550-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  545K Aug 31 21:58 gen-word-60-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  578K Aug 31 21:58 gen-word-65-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  624K Aug 31 21:58 gen-word-70-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  658K Aug 31 21:58 gen-word-75-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  710K Aug 31 21:58 gen-word-80-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  738K Aug 31 21:58 gen-word-85-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  772K Aug 31 21:58 gen-word-90-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  809K Aug 31 21:58 gen-word-95-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Aug 31 21:58 shuffle-word-10-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  567K Aug 31 21:58 shuffle-word-100-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  557K Aug 31 21:58 shuffle-word-105-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  556K Aug 31 21:58 shuffle-word-110-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  551K Aug 31 21:58 shuffle-word-115-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  552K Aug 31 21:58 shuffle-word-120-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  555K Aug 31 21:58 shuffle-word-125-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  547K Aug 31 21:58 shuffle-word-130-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  547K Aug 31 21:58 shuffle-word-135-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  540K Aug 31 21:58 shuffle-word-140-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  547K Aug 31 21:58 shuffle-word-145-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  433K Aug 31 21:58 shuffle-word-15-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  544K Aug 31 21:58 shuffle-word-150-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  541K Aug 31 21:58 shuffle-word-155-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  541K Aug 31 21:58 shuffle-word-160-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  541K Aug 31 21:58 shuffle-word-165-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  545K Aug 31 21:58 shuffle-word-170-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  545K Aug 31 21:58 shuffle-word-175-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  541K Aug 31 21:58 shuffle-word-180-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  539K Aug 31 21:58 shuffle-word-185-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  540K Aug 31 21:58 shuffle-word-190-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  540K Aug 31 21:58 shuffle-word-195-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  393K Aug 31 21:58 shuffle-word-20-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  544K Aug 31 21:58 shuffle-word-200-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  537K Aug 31 21:58 shuffle-word-205-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  540K Aug 31 21:58 shuffle-word-210-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  537K Aug 31 21:58 shuffle-word-215-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  535K Aug 31 21:58 shuffle-word-220-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  532K Aug 31 21:58 shuffle-word-225-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  536K Aug 31 21:58 shuffle-word-230-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  534K Aug 31 21:58 shuffle-word-235-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  533K Aug 31 21:58 shuffle-word-240-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  533K Aug 31 21:58 shuffle-word-245-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  357K Aug 31 21:58 shuffle-word-25-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  534K Aug 31 21:58 shuffle-word-250-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  534K Aug 31 21:58 shuffle-word-255-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  534K Aug 31 21:58 shuffle-word-260-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  534K Aug 31 21:58 shuffle-word-265-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  532K Aug 31 21:58 shuffle-word-270-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  534K Aug 31 21:58 shuffle-word-275-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  533K Aug 31 21:58 shuffle-word-280-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  533K Aug 31 21:58 shuffle-word-285-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  535K Aug 31 21:58 shuffle-word-290-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  535K Aug 31 21:58 shuffle-word-295-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  349K Aug 31 21:58 shuffle-word-30-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  536K Aug 31 21:58 shuffle-word-300-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  532K Aug 31 21:58 shuffle-word-305-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  529K Aug 31 21:58 shuffle-word-310-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  532K Aug 31 21:58 shuffle-word-315-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  532K Aug 31 21:58 shuffle-word-320-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  532K Aug 31 21:58 shuffle-word-325-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  529K Aug 31 21:58 shuffle-word-330-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  526K Aug 31 21:58 shuffle-word-335-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  527K Aug 31 21:58 shuffle-word-340-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  529K Aug 31 21:58 shuffle-word-345-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  326K Aug 31 21:58 shuffle-word-35-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  528K Aug 31 21:58 shuffle-word-350-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  533K Aug 31 21:58 shuffle-word-355-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  530K Aug 31 21:58 shuffle-word-360-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  530K Aug 31 21:58 shuffle-word-365-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  530K Aug 31 21:58 shuffle-word-370-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  529K Aug 31 21:58 shuffle-word-375-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  531K Aug 31 21:58 shuffle-word-380-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  530K Aug 31 21:58 shuffle-word-385-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  531K Aug 31 21:58 shuffle-word-390-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  529K Aug 31 21:58 shuffle-word-395-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  320K Aug 31 21:58 shuffle-word-40-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  531K Aug 31 21:58 shuffle-word-400-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  528K Aug 31 21:58 shuffle-word-405-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  529K Aug 31 21:58 shuffle-word-410-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Aug 31 21:58 shuffle-word-415-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  526K Aug 31 21:58 shuffle-word-420-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Aug 31 21:58 shuffle-word-425-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  530K Aug 31 21:58 shuffle-word-430-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  526K Aug 31 21:58 shuffle-word-435-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  529K Aug 31 21:58 shuffle-word-440-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  528K Aug 31 21:58 shuffle-word-445-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  314K Aug 31 21:58 shuffle-word-45-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  527K Aug 31 21:58 shuffle-word-450-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  531K Aug 31 21:58 shuffle-word-455-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  526K Aug 31 21:58 shuffle-word-460-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Aug 31 21:58 shuffle-word-465-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  527K Aug 31 21:58 shuffle-word-470-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Aug 31 21:58 shuffle-word-475-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  530K Aug 31 21:58 shuffle-word-480-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  528K Aug 31 21:58 shuffle-word-485-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Aug 31 21:58 shuffle-word-490-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  529K Aug 31 21:58 shuffle-word-495-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  814K Aug 31 21:58 shuffle-word-5-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  621K Aug 31 21:58 shuffle-word-50-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  530K Aug 31 21:58 shuffle-word-500-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Aug 31 21:58 shuffle-word-505-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  528K Aug 31 21:58 shuffle-word-510-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Aug 31 21:58 shuffle-word-515-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  531K Aug 31 21:58 shuffle-word-520-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  530K Aug 31 21:58 shuffle-word-525-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  527K Aug 31 21:58 shuffle-word-530-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Aug 31 21:58 shuffle-word-535-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Aug 31 21:58 shuffle-word-540-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  526K Aug 31 21:58 shuffle-word-545-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  597K Aug 31 21:58 shuffle-word-55-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  526K Aug 31 21:58 shuffle-word-550-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  603K Aug 31 21:58 shuffle-word-60-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  593K Aug 31 21:58 shuffle-word-65-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  580K Aug 31 21:58 shuffle-word-70-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  583K Aug 31 21:58 shuffle-word-75-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  574K Aug 31 21:58 shuffle-word-80-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  574K Aug 31 21:58 shuffle-word-85-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  571K Aug 31 21:58 shuffle-word-90-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  574K Aug 31 21:58 shuffle-word-95-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   49K Aug 31 21:58 word-2-count.jsonl\n"
-     ]
-    }
-   ],
-   "source": [
-    "%%script bash\n",
-    "\n",
-    "########################################\n",
-    "# Generate the required jsonl dataset\n",
-    "########################################\n",
-    "\n",
-    "# Reset the dataset dir\n",
-    "mkdir -p ../dataset\n",
-    "rm -rf ../dataset/*.jsonl\n",
-    "\n",
-    "# Generate the various datasets\n",
-    "echo \"## Generating word reptition dataset ##\"\n",
-    "\n",
-    "#\n",
-    "# We reduce the training set for lower word count - and shift the focus upwards\n",
-    "#\n",
-    "python ../memory_script/gen_limited_prompt_completion_jsonl.py ../dataset/word-2-count.jsonl 2 400 &\n",
-    "for i in {5..45..5} \n",
-    "do\n",
-    "    python ../memory_script/gen_limited_prompt_completion_jsonl.py ../dataset/gen-word-$i-count.jsonl $i 400 & \n",
-    "    python ../memory_script/shuffle_limited_prompt_completion_jsonl.py ../dataset/shuffle-word-$i-count.jsonl $i 10 & \n",
-    "done\n",
-    "\n",
-    "#\n",
-    "# Ramping up the 50+ - 510 words dataset\n",
-    "# \n",
-    "for i in {50..550..5} \n",
-    "do\n",
-    "    python ../memory_script/gen_limited_prompt_completion_jsonl.py ../dataset/gen-word-$i-count.jsonl $i 800 & \n",
-    "    python ../memory_script/shuffle_limited_prompt_completion_jsonl.py ../dataset/shuffle-word-$i-count.jsonl $i 20 & \n",
-    "done\n",
-    "\n",
-    "wait\n",
-    "echo \"## Done ##\"\n",
-    "\n",
-    "ls -alh ../dataset/"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 6,
-   "id": "d333baca",
-   "metadata": {
-    "execution": {
-     "iopub.execute_input": "2023-08-31T21:58:43.238676Z",
-     "iopub.status.busy": "2023-08-31T21:58:43.238125Z",
-     "iopub.status.idle": "2023-09-01T02:53:33.810375Z",
-     "shell.execute_reply": "2023-09-01T02:53:33.808544Z"
-    },
-    "papermill": {
-     "duration": 17690.609691,
-     "end_time": "2023-09-01T02:53:33.812814",
-     "exception": false,
-     "start_time": "2023-08-31T21:58:43.203123",
-     "status": "completed"
-    },
-    "tags": []
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Setting ds_accelerator to cuda (auto detect)\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[RWKV.model] Running RWKV model using 'torch-jit' with torch '2.0.1+cu118'\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "/usr/local/lib/python3.11/dist-packages/lightning/pytorch/cli.py:484: UserWarning: LightningCLI's args parameter is intended to run from within Python like if it were from the command line. To prevent mistakes it is not recommended to provide both args and command line arguments, got: sys.argv[1:]=['fit', '-c', '/actions-runner/_work/RWKV-infctx-trainer/RWKV-infctx-trainer/notebook/experiment/rwkv-x-exp/v5-memory/config-mem-template.yaml', '--trainer.logger.init_args.name=v5-L96-D1024-E0.1 - Mem-Tune ctx-1k (train-ctx=1k, deepspeed_stage_1)', '--trainer.strategy=deepspeed_stage_1', '--trainer.devices=auto', '--trainer.callbacks.init_args.dirpath=../checkpoint/v5-L96-D1024-E0_1-mem-ctx-1k/', '--model.lr_init=4e-4', '--model.lr_final=2e-4', '--data.max_token_size=1024', '--model.ctx_len=1024', '--model.bptt_learning_range=1', '--model.load_model=../model/v5-L96-D1024-E0_1-mem-ctx-512.pth'], args=['fit', '-c', '/actions-runner/_work/RWKV-infctx-trainer/RWKV-infctx-trainer/notebook/experiment/rwkv-x-exp/v5-memory/config-mem-template.yaml', '--trainer.logger.init_args.name=v5-L96-D1024-E0.1 - Mem-Tune ctx-1k (train-ctx=1k, deepspeed_stage_1)', '--trainer.strategy=deepspeed_stage_1', '--trainer.devices=auto', '--trainer.callbacks.init_args.dirpath=../checkpoint/v5-L96-D1024-E0_1-mem-ctx-1k/', '--model.lr_init=4e-4', '--model.lr_final=2e-4', '--data.max_token_size=1024', '--model.ctx_len=1024', '--model.bptt_learning_range=1', '--model.load_model=../model/v5-L96-D1024-E0_1-mem-ctx-512.pth'].\r\n",
-      "  rank_zero_warn(\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "/usr/local/lib/python3.11/dist-packages/lightning/fabric/utilities/seed.py:39: UserWarning: No seed found, seed set to 552501025\r\n",
-      "  rank_zero_warn(f\"No seed found, seed set to {seed}\")\r\n",
-      "Global seed set to 552501025\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\u001b[34m\u001b[1mwandb\u001b[0m: Currently logged in as: \u001b[33mpicocreator\u001b[0m (\u001b[33mrwkv-x-dev\u001b[0m). Use \u001b[1m`wandb login --relogin`\u001b[0m to force relogin\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\u001b[34m\u001b[1mwandb\u001b[0m: Tracking run with wandb version 0.15.9\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: Run data is saved locally in \u001b[35m\u001b[1m./wandb/run-20230831_215849-y5kr73vx\u001b[0m\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: Run \u001b[1m`wandb offline`\u001b[0m to turn off syncing.\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: Syncing run \u001b[33mv5-L96-D1024-E0.1 - Mem-Tune ctx-1k (train-ctx=1k, deepspeed_stage_1)\u001b[0m\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: ⭐️ View project at \u001b[34m\u001b[4mhttps://wandb.ai/rwkv-x-dev/RWKV-X-Experiments\u001b[0m\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: 🚀 View run at \u001b[34m\u001b[4mhttps://wandb.ai/rwkv-x-dev/RWKV-X-Experiments/runs/y5kr73vx\u001b[0m\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "/usr/local/lib/python3.11/dist-packages/lightning/fabric/connector.py:562: UserWarning: bf16 is supported for historical reasons but its usage is discouraged. Please set your precision to bf16-mixed instead!\r\n",
-      "  rank_zero_warn(\r\n",
-      "GPU available: True (cuda), used: True\r\n",
-      "TPU available: False, using: 0 TPU cores\r\n",
-      "IPU available: False, using: 0 IPUs\r\n",
-      "HPU available: False, using: 0 HPUs\r\n",
-      "\r\n",
-      "\r\n",
-      "[RWKV.Trainer] Applying 'target_batch_size' with the following:\r\n",
-      "   - target_batch_size:       256\r\n",
-      "   - num_nodes:               1\r\n",
-      "   - num_devices:             8\r\n",
-      "   - accumulate_grad_batches: 32\r\n",
-      "   - effective_batch_size:    256\r\n",
-      "\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Resolving data files:   0%|                             | 0/221 [00:00<?, ?it/s]\r",
-      "Resolving data files: 100%|████████████████| 221/221 [00:00<00:00, 33598.22it/s]\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Downloading and preparing dataset json/default to /actions-runner/.cache/huggingface/datasets/json/default-8b64af9fc1903a51/0.0.0/8bb11242116d547c741b2e8a1f18598ffdd40a1d4f2a2872c7a28b697434bc96...\r\n",
-      "\r",
-      "Downloading data files:   0%|                             | 0/1 [00:00<?, ?it/s]\r",
-      "Downloading data files: 100%|████████████████████| 1/1 [00:00<00:00, 301.21it/s]\r\n",
-      "\r",
-      "Extracting data files:   0%|                              | 0/1 [00:00<?, ?it/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Extracting data files: 100%|██████████████████████| 1/1 [00:00<00:00, 15.64it/s]\r\n",
-      "\r",
-      "Generating train split: 0 examples [00:00, ? examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Setting ds_accelerator to cuda (auto detect)\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Setting ds_accelerator to cuda (auto detect)\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Setting ds_accelerator to cuda (auto detect)\r\n",
-      "Setting ds_accelerator to cuda (auto detect)\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Setting ds_accelerator to cuda (auto detect)\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Setting ds_accelerator to cuda (auto detect)\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Setting ds_accelerator to cuda (auto detect)\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[RWKV.model] Running RWKV model using 'torch-jit' with torch '2.0.1+cu118'\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[RWKV.model] Running RWKV model using 'torch-jit' with torch '2.0.1+cu118'\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[RWKV.model] Running RWKV model using 'torch-jit' with torch '2.0.1+cu118'\r\n",
-      "[RWKV.model] Running RWKV model using 'torch-jit' with torch '2.0.1+cu118'\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[RWKV.model] Running RWKV model using 'torch-jit' with torch '2.0.1+cu118'\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[RWKV.model] Running RWKV model using 'torch-jit' with torch '2.0.1+cu118'\r\n",
-      "[RWKV.model] Running RWKV model using 'torch-jit' with torch '2.0.1+cu118'\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 3] Global seed set to 552501025\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 1] Global seed set to 552501025\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 6] Global seed set to 552501025\r\n",
-      "[rank: 2] Global seed set to 552501025\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 5] Global seed set to 552501025\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 4] Global seed set to 552501025\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 7] Global seed set to 552501025\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 2800 examples [00:11, 245.64 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 18000 examples [00:11, 2121.07 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 36400 examples [00:11, 5253.93 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 51600 examples [00:11, 8769.47 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 67200 examples [00:11, 13650.77 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 82800 examples [00:11, 19995.29 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 97619 examples [00:12, 26253.15 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                                                                   \r"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Dataset json downloaded and prepared to /actions-runner/.cache/huggingface/datasets/json/default-8b64af9fc1903a51/0.0.0/8bb11242116d547c741b2e8a1f18598ffdd40a1d4f2a2872c7a28b697434bc96. Subsequent calls will reuse this data.\r\n",
-      "\r",
-      "  0%|                                                     | 0/1 [00:00<?, ?it/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "100%|█████████████████████████████████████████████| 1/1 [00:00<00:00, 75.46it/s]\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   0%|                      | 0/124524 [00:00<?, ? examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   0%|           | 5/124524 [00:02<14:52:14,  2.33 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   0%|           | 454/124524 [00:02<08:33, 241.49 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   1%|           | 995/124524 [00:02<03:33, 577.48 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   1%|          | 1178/124524 [00:02<03:03, 672.81 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   1%|          | 1369/124524 [00:02<02:42, 758.61 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   1%|          | 1526/124524 [00:03<02:27, 831.13 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   1%|▏         | 1676/124524 [00:03<02:33, 801.10 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   1%|▏         | 1826/124524 [00:03<03:00, 681.36 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   2%|▏        | 2185/124524 [00:03<01:57, 1038.61 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   2%|▏        | 2714/124524 [00:03<01:11, 1709.45 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   2%|▏        | 3062/124524 [00:04<01:05, 1844.72 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   3%|▎        | 3588/124524 [00:04<00:48, 2497.31 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   3%|▎        | 3948/124524 [00:04<00:44, 2700.48 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   3%|▎        | 4287/124524 [00:04<01:01, 1968.24 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   4%|▎        | 4811/124524 [00:04<00:51, 2340.02 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   4%|▍        | 5564/124524 [00:04<00:42, 2809.91 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   5%|▍        | 6484/124524 [00:05<00:34, 3434.02 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   6%|▍        | 6855/124524 [00:05<00:39, 2957.90 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   6%|▌        | 7560/124524 [00:05<00:35, 3302.55 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   6%|▌        | 8011/124524 [00:05<00:35, 3249.44 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   7%|▌        | 8354/124524 [00:05<00:45, 2563.03 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   8%|▋        | 9863/124524 [00:06<00:31, 3606.63 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   9%|▋       | 11344/124524 [00:06<00:21, 5356.73 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  10%|▊       | 12023/124524 [00:06<00:44, 2532.71 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  11%|▊       | 13481/124524 [00:07<00:37, 2987.45 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  12%|▉       | 15564/124524 [00:07<00:22, 4846.80 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  14%|█       | 16866/124524 [00:07<00:18, 5918.63 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  14%|█▏      | 17885/124524 [00:07<00:23, 4482.98 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  15%|█▏      | 18679/124524 [00:08<00:23, 4584.94 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  16%|█▏      | 19385/124524 [00:08<00:30, 3424.44 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  16%|█▎      | 20053/124524 [00:08<00:31, 3355.72 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  17%|█▎      | 21040/124524 [00:08<00:29, 3512.93 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  17%|█▍      | 21535/124524 [00:09<00:34, 3016.52 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  18%|█▍      | 22097/124524 [00:09<00:40, 2533.42 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  18%|█▍      | 22408/124524 [00:10<01:04, 1578.25 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  18%|█▍      | 22872/124524 [00:10<00:54, 1871.26 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  19%|█▍      | 23163/124524 [00:10<01:00, 1678.31 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  19%|█▌      | 23656/124524 [00:10<00:54, 1864.01 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  19%|█▌      | 24255/124524 [00:11<00:51, 1945.63 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  20%|█▋      | 25383/124524 [00:11<00:38, 2587.31 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  21%|█▋      | 25666/124524 [00:11<00:45, 2175.96 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  21%|█▋      | 26608/124524 [00:11<00:30, 3177.39 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  22%|█▋      | 27054/124524 [00:11<00:40, 2420.21 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  22%|█▊      | 27951/124524 [00:12<00:29, 3260.98 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  23%|█▊      | 28773/124524 [00:12<00:23, 4035.54 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  24%|█▉      | 29326/124524 [00:12<00:29, 3274.57 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  24%|█▉      | 29778/124524 [00:12<00:27, 3466.59 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  24%|█▉      | 30225/124524 [00:12<00:31, 3020.99 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  25%|██      | 31382/124524 [00:13<00:24, 3851.89 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  26%|██      | 32612/124524 [00:13<00:22, 4103.23 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  27%|██▏     | 33404/124524 [00:13<00:20, 4378.65 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  27%|██▏     | 33922/124524 [00:13<00:24, 3685.71 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  28%|██▏     | 34734/124524 [00:13<00:28, 3157.27 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  28%|██▎     | 35085/124524 [00:14<00:34, 2574.86 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  29%|██▎     | 35887/124524 [00:14<00:33, 2623.43 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  29%|██▎     | 36684/124524 [00:14<00:32, 2698.82 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  30%|██▍     | 36970/124524 [00:15<00:38, 2283.64 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  30%|██▍     | 37290/124524 [00:15<00:57, 1510.40 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  30%|██▍     | 37550/124524 [00:15<01:09, 1248.31 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  31%|██▍     | 38383/124524 [00:16<00:46, 1840.72 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  31%|██▍     | 38827/124524 [00:16<00:46, 1826.77 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  32%|██▌     | 39717/124524 [00:16<00:31, 2708.24 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  32%|██▌     | 40144/124524 [00:16<00:28, 2929.63 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  33%|██▋     | 40880/124524 [00:16<00:24, 3387.73 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  33%|██▋     | 41421/124524 [00:16<00:22, 3663.65 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  34%|██▋     | 42213/124524 [00:16<00:18, 4549.84 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  34%|██▊     | 42807/124524 [00:17<00:16, 4866.72 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  35%|██▊     | 43366/124524 [00:17<00:20, 3964.72 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  36%|██▊     | 44651/124524 [00:17<00:13, 5874.49 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  37%|██▉     | 46193/124524 [00:17<00:09, 8125.73 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  38%|███     | 47177/124524 [00:17<00:09, 8324.46 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  39%|███     | 48124/124524 [00:17<00:10, 7143.41 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  39%|███▏    | 48944/124524 [00:17<00:11, 6564.19 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  40%|███▏    | 50200/124524 [00:18<00:09, 7891.20 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  41%|███▎    | 51086/124524 [00:18<00:10, 7031.38 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  42%|███▍    | 52842/124524 [00:18<00:07, 9378.63 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  43%|███▍    | 53889/124524 [00:18<00:07, 9638.23 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  45%|███▏   | 55653/124524 [00:18<00:06, 11384.38 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  46%|███▋    | 57382/124524 [00:18<00:06, 9984.83 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  47%|███▊    | 58493/124524 [00:18<00:07, 9141.98 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  48%|███▊    | 59477/124524 [00:19<00:07, 9125.02 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  49%|███▉    | 60440/124524 [00:19<00:06, 9163.38 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  49%|███▉    | 61420/124524 [00:19<00:06, 9323.34 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  50%|████    | 62439/124524 [00:19<00:06, 9482.24 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  51%|████    | 63511/124524 [00:19<00:06, 9695.33 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  52%|███▋   | 64880/124524 [00:19<00:05, 10803.22 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  53%|████▏   | 65981/124524 [00:19<00:08, 6905.69 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  54%|████▎   | 67160/124524 [00:19<00:07, 7517.34 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  55%|████▍   | 68556/124524 [00:20<00:06, 8836.60 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  56%|████▍   | 69587/124524 [00:20<00:06, 8555.96 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  57%|████▌   | 70558/124524 [00:20<00:06, 8247.89 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  58%|████   | 72146/124524 [00:20<00:05, 10016.61 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  59%|████   | 73242/124524 [00:20<00:05, 10202.28 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  60%|████▊   | 74329/124524 [00:20<00:05, 9943.73 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  61%|████▎  | 75736/124524 [00:20<00:04, 10905.36 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  62%|████▎  | 76878/124524 [00:20<00:04, 10593.47 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  63%|█████   | 77969/124524 [00:21<00:05, 8851.59 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  64%|████▍  | 79478/124524 [00:21<00:04, 10341.99 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  65%|█████▏  | 80600/124524 [00:21<00:06, 6994.73 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  66%|█████▎  | 82142/124524 [00:21<00:05, 8298.12 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  67%|█████▎  | 83149/124524 [00:21<00:05, 7965.54 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  68%|█████▍  | 84080/124524 [00:21<00:05, 7409.41 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  68%|█████▍  | 84905/124524 [00:21<00:05, 7036.25 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  69%|█████▌  | 85875/124524 [00:22<00:05, 7608.76 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  70%|█████▌  | 86695/124524 [00:22<00:05, 7250.81 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  71%|█████▋  | 87819/124524 [00:22<00:04, 7513.40 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  71%|█████▋  | 88600/124524 [00:22<00:05, 6747.62 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  72%|█████▋  | 89302/124524 [00:22<00:05, 6172.61 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  72%|█████▊  | 89940/124524 [00:22<00:07, 4354.69 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  73%|█████▊  | 90683/124524 [00:23<00:06, 4921.78 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  73%|█████▊  | 91275/124524 [00:23<00:06, 4843.66 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  74%|█████▉  | 91824/124524 [00:23<00:06, 4777.27 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  74%|█████▉  | 92354/124524 [00:23<00:06, 4833.89 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  75%|█████▉  | 93070/124524 [00:23<00:05, 5359.96 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  75%|██████  | 93643/124524 [00:23<00:05, 5338.65 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  76%|██████  | 94238/124524 [00:23<00:05, 5500.45 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  76%|██████  | 94871/124524 [00:23<00:05, 5651.41 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  77%|██████▏ | 95449/124524 [00:23<00:05, 5541.53 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  77%|██████▏ | 96013/124524 [00:24<00:05, 5376.29 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  78%|██████▏ | 96623/124524 [00:24<00:05, 5555.95 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  78%|██████▏ | 97186/124524 [00:24<00:05, 4947.89 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  78%|██████▎ | 97696/124524 [00:24<00:07, 3600.35 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  79%|██████▎ | 98118/124524 [00:24<00:08, 3041.99 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  79%|██████▎ | 98561/124524 [00:24<00:07, 3307.05 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  79%|██████▎ | 98942/124524 [00:25<00:08, 2843.62 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  80%|██████▍ | 99351/124524 [00:25<00:08, 3001.54 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  80%|██████▍ | 99685/124524 [00:25<00:08, 3033.26 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  80%|█████▌ | 100015/124524 [00:25<00:08, 3010.92 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  81%|█████▋ | 100338/124524 [00:25<00:07, 3042.74 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  81%|█████▋ | 100658/124524 [00:25<00:08, 2903.67 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  81%|█████▋ | 100971/124524 [00:25<00:08, 2915.84 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  81%|█████▋ | 101367/124524 [00:25<00:07, 3187.26 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  82%|█████▋ | 101695/124524 [00:25<00:07, 3061.98 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  82%|█████▋ | 102008/124524 [00:26<00:07, 2999.31 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  82%|█████▊ | 102319/124524 [00:26<00:07, 2906.89 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  82%|█████▊ | 102620/124524 [00:26<00:07, 2920.38 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  83%|█████▊ | 102932/124524 [00:26<00:07, 2961.36 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  83%|█████▊ | 103291/124524 [00:26<00:06, 3126.63 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  83%|█████▊ | 103606/124524 [00:26<00:07, 2758.64 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  83%|█████▊ | 103925/124524 [00:26<00:07, 2872.98 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  84%|█████▊ | 104222/124524 [00:26<00:07, 2768.86 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  84%|█████▊ | 104509/124524 [00:26<00:07, 2578.29 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  84%|█████▉ | 104927/124524 [00:27<00:06, 2945.72 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  85%|█████▉ | 105289/124524 [00:27<00:06, 3111.82 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  85%|█████▉ | 105659/124524 [00:27<00:06, 2899.92 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  85%|█████▉ | 106047/124524 [00:27<00:05, 3089.74 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  85%|█████▉ | 106371/124524 [00:27<00:06, 3022.23 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  86%|█████▉ | 106685/124524 [00:27<00:06, 2971.21 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  86%|██████ | 106989/124524 [00:27<00:07, 2449.28 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  86%|██████ | 107315/124524 [00:27<00:06, 2634.43 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  86%|██████ | 107600/124524 [00:28<00:06, 2451.23 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  87%|██████ | 107909/124524 [00:28<00:06, 2491.50 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  87%|██████ | 108217/124524 [00:28<00:06, 2488.24 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  87%|██████ | 108610/124524 [00:28<00:05, 2845.91 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  87%|██████ | 108926/124524 [00:28<00:05, 2917.51 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  88%|██████▏| 109226/124524 [00:28<00:05, 2882.09 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  88%|██████▏| 109549/124524 [00:28<00:05, 2977.91 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  88%|██████▏| 110029/124524 [00:28<00:04, 3492.43 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  89%|██████▏| 110496/124524 [00:28<00:03, 3692.34 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  89%|██████▎| 111228/124524 [00:29<00:02, 4696.71 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  90%|██████▎| 111710/124524 [00:29<00:02, 4562.79 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  90%|██████▎| 112195/124524 [00:29<00:03, 3649.72 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  90%|██████▎| 112597/124524 [00:29<00:03, 2995.07 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  91%|██████▎| 112946/124524 [00:29<00:03, 2979.50 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  91%|██████▎| 113277/124524 [00:29<00:04, 2647.25 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  91%|██████▍| 113571/124524 [00:29<00:04, 2688.50 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|██████▍| 114056/124524 [00:30<00:03, 2863.82 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|██████▍| 114447/124524 [00:30<00:03, 3024.60 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|██████▍| 114772/124524 [00:30<00:03, 2830.35 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|██████▍| 115067/124524 [00:30<00:03, 2587.40 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|██████▍| 115383/124524 [00:30<00:03, 2720.13 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|██████▌| 115672/124524 [00:30<00:03, 2751.21 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|██████▌| 115956/124524 [00:30<00:03, 2739.19 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|██████▌| 116320/124524 [00:30<00:03, 2637.78 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|██████▌| 116596/124524 [00:31<00:03, 2442.98 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|██████▌| 116851/124524 [00:31<00:03, 2107.78 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|██████▌| 117131/124524 [00:31<00:03, 2259.04 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|██████▌| 117370/124524 [00:31<00:03, 1854.32 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|██████▌| 117580/124524 [00:31<00:03, 1738.33 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|██████▌| 117769/124524 [00:31<00:04, 1688.34 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|██████▋| 117960/124524 [00:31<00:03, 1737.40 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|██████▋| 118155/124524 [00:31<00:03, 1786.04 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|██████▋| 118353/124524 [00:32<00:03, 1815.74 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|██████▋| 118600/124524 [00:32<00:02, 1974.71 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  96%|██████▋| 118970/124524 [00:32<00:02, 2421.04 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  96%|██████▋| 119328/124524 [00:32<00:01, 2723.07 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  96%|██████▋| 119610/124524 [00:32<00:01, 2712.79 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  96%|██████▋| 119887/124524 [00:32<00:02, 2080.24 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  96%|██████▊| 120120/124524 [00:32<00:02, 1663.49 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  97%|██████▊| 120322/124524 [00:33<00:02, 1482.29 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  97%|██████▊| 120504/124524 [00:33<00:02, 1398.51 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  97%|██████▊| 120694/124524 [00:33<00:02, 1462.63 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  97%|██████▊| 120856/124524 [00:33<00:02, 1308.39 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  97%|██████▊| 121001/124524 [00:33<00:02, 1234.44 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  97%|██████▊| 121131/124524 [00:33<00:03, 1097.89 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  97%|██████▊| 121263/124524 [00:33<00:02, 1146.44 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  97%|██████▊| 121385/124524 [00:34<00:02, 1083.46 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  98%|██████▊| 121566/124524 [00:34<00:02, 1256.85 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  98%|██████▊| 121711/124524 [00:34<00:02, 1244.39 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  98%|██████▊| 121849/124524 [00:34<00:02, 1081.61 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  98%|███████▊| 121964/124524 [00:34<00:02, 899.58 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  98%|███████▊| 122066/124524 [00:34<00:03, 709.93 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  98%|███████▊| 122149/124524 [00:35<00:03, 675.67 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  98%|███████▊| 122236/124524 [00:35<00:03, 671.06 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  98%|███████▊| 122339/124524 [00:35<00:02, 731.27 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  98%|███████▊| 122429/124524 [00:35<00:02, 765.74 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  98%|███████▊| 122520/124524 [00:35<00:02, 687.33 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  98%|███████▉| 122597/124524 [00:35<00:02, 651.16 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 122667/124524 [00:35<00:03, 599.16 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 122733/124524 [00:36<00:03, 516.75 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 122788/124524 [00:36<00:03, 514.44 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 122854/124524 [00:36<00:03, 530.84 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 122912/124524 [00:36<00:03, 533.91 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 122967/124524 [00:36<00:03, 501.51 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 123037/124524 [00:36<00:02, 534.79 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 123105/124524 [00:36<00:02, 485.29 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 123158/124524 [00:36<00:03, 420.79 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 123205/124524 [00:37<00:03, 429.10 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 123252/124524 [00:37<00:04, 276.51 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 123395/124524 [00:37<00:02, 475.03 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 123480/124524 [00:37<00:01, 532.53 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 123587/124524 [00:37<00:01, 646.21 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 123672/124524 [00:37<00:01, 670.96 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 123774/124524 [00:37<00:01, 737.79 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 123861/124524 [00:38<00:01, 656.39 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 123934/124524 [00:38<00:01, 497.36 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 123994/124524 [00:38<00:01, 404.79 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 124045/124524 [00:38<00:01, 412.05 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 124094/124524 [00:38<00:01, 409.95 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 124156/124524 [00:38<00:00, 396.78 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 124201/124524 [00:39<00:00, 367.44 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 124240/124524 [00:39<00:00, 296.89 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 124274/124524 [00:39<00:01, 225.23 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 124301/124524 [00:39<00:01, 166.97 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 124323/124524 [00:40<00:01, 130.04 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 124354/124524 [00:40<00:01, 149.44 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 124376/124524 [00:40<00:00, 159.09 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 124400/124524 [00:40<00:00, 171.20 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 124422/124524 [00:40<00:00, 161.55 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 124448/124524 [00:41<00:00, 107.44 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|████████▉| 124464/124524 [00:41<00:00, 83.55 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|████████▉| 124478/124524 [00:41<00:00, 89.93 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|████████▉| 124490/124524 [00:41<00:00, 93.98 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 124508/124524 [00:41<00:00, 103.54 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|████████▉| 124521/124524 [00:42<00:00, 61.77 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                                                                                \r"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):   0%|                   | 0/124524 [00:00<?, ? examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 7] Global seed set to 552501025"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "initializing deepspeed distributed: GLOBAL_RANK: 7, MEMBER: 8/8\r\n",
-      "[2023-08-31 22:01:25,133] [WARNING] [comm.py:152:init_deepspeed_backend] NCCL backend in DeepSpeed not yet implemented\r\n",
-      "\r",
-      "Filter (num_proc=64):   1%|       | 1000/124524 [00:02<04:31, 454.25 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):   5%|▎     | 6000/124524 [00:02<00:34, 3430.10 examples/s][rank: 5] Global seed set to 552501025"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "initializing deepspeed distributed: GLOBAL_RANK: 5, MEMBER: 6/8\r\n",
-      "[2023-08-31 22:01:25,347] [WARNING] [comm.py:152:init_deepspeed_backend] NCCL backend in DeepSpeed not yet implemented\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  10%|▍    | 12000/124524 [00:02<00:14, 7875.82 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  13%|▌   | 15945/124524 [00:02<00:10, 10359.40 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  16%|▋   | 19891/124524 [00:02<00:09, 11546.95 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  18%|▋   | 22727/124524 [00:02<00:07, 13451.51 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  21%|▊   | 25673/124524 [00:03<00:06, 15318.81 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  24%|▉   | 29564/124524 [00:03<00:04, 19218.24 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 4] Global seed set to 552501025\r\n",
-      "initializing deepspeed distributed: GLOBAL_RANK: 4, MEMBER: 5/8\r\n",
-      "[2023-08-31 22:01:26,256] [WARNING] [comm.py:152:init_deepspeed_backend] NCCL backend in DeepSpeed not yet implemented\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  29%|█▏  | 36401/124524 [00:03<00:03, 25705.17 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  33%|█▎  | 41293/124524 [00:03<00:02, 29564.52 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  38%|█▌  | 47075/124524 [00:03<00:02, 32478.71 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  43%|█▋  | 53911/124524 [00:03<00:01, 36659.42 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  48%|█▉  | 59856/124524 [00:03<00:01, 40366.72 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  52%|██  | 64802/124524 [00:04<00:02, 27647.77 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  55%|██▏ | 68692/124524 [00:04<00:02, 24403.63 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  60%|██▍ | 74584/124524 [00:04<00:01, 27233.52 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  64%|██▌ | 79476/124524 [00:04<00:01, 30801.55 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  68%|██▋ | 84422/124524 [00:04<00:01, 34598.94 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  72%|██▊ | 89258/124524 [00:04<00:01, 32084.92 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  76%|███ | 94041/124524 [00:05<00:00, 34534.52 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  79%|███▏| 97932/124524 [00:05<00:01, 23458.06 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  82%|██▍| 101714/124524 [00:05<00:01, 20701.58 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  87%|██▌| 108443/124524 [00:05<00:00, 27048.91 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 1] Global seed set to 552501025\r\n",
-      "initializing deepspeed distributed: GLOBAL_RANK: 1, MEMBER: 2/8\r\n",
-      "[2023-08-31 22:01:28,874] [WARNING] [comm.py:152:init_deepspeed_backend] NCCL backend in DeepSpeed not yet implemented\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  90%|██▋| 112227/124524 [00:05<00:00, 26522.67 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  93%|██▊| 116010/124524 [00:06<00:00, 25052.66 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  95%|██▊| 118848/124524 [00:06<00:00, 16873.24 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 6] Global seed set to 552501025\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "initializing deepspeed distributed: GLOBAL_RANK: 6, MEMBER: 7/8\r\n",
-      "[2023-08-31 22:01:29,547] [WARNING] [comm.py:152:init_deepspeed_backend] NCCL backend in DeepSpeed not yet implemented\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 3] Global seed set to 552501025\r\n",
-      "initializing deepspeed distributed: GLOBAL_RANK: 3, MEMBER: 4/8\r\n",
-      "[2023-08-31 22:01:29,600] [WARNING] [comm.py:152:init_deepspeed_backend] NCCL backend in DeepSpeed not yet implemented\r\n",
-      "\r",
-      "Filter (num_proc=64):  98%|██▉| 121686/124524 [00:06<00:00, 16674.46 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64): 100%|███| 124524/124524 [00:07<00:00, 13194.22 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                                                                                \r"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (0/1 shards):   0%|        | 0/124208 [00:00<?, ? examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 2] Global seed set to 552501025\r\n",
-      "initializing deepspeed distributed: GLOBAL_RANK: 2, MEMBER: 3/8\r\n",
-      "[2023-08-31 22:01:30,838] [WARNING] [comm.py:152:init_deepspeed_backend] NCCL backend in DeepSpeed not yet implemented\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (0/1 shards):  10%| | 12000/124208 [00:00<00:01, 107734.33 ex"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (0/1 shards):  22%|▏| 27000/124208 [00:00<00:00, 126444.47 ex"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (0/1 shards):  34%|▎| 42000/124208 [00:00<00:00, 133059.91 ex"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (0/1 shards):  47%|▍| 58000/124208 [00:00<00:00, 136553.24 ex"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (0/1 shards):  60%|▌| 74000/124208 [00:00<00:00, 138323.80 ex"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (0/1 shards):  72%|▋| 89000/124208 [00:00<00:00, 139301.74 ex"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (0/1 shards):  83%|▊| 103000/124208 [00:00<00:00, 136645.32 e"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (0/1 shards):  94%|▉| 117000/124208 [00:00<00:00, 136842.79 e"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (1/1 shards): 100%|█| 124208/124208 [00:00<00:00, 136842.79 e\r",
-      "                                                                                \r",
-      "\r",
-      "Saving the dataset (0/1 shards):   0%|           | 0/125 [00:00<?, ? examples/s]\r",
-      "Saving the dataset (1/1 shards): 100%|█| 125/125 [00:00<00:00, 10330.39 examples\r",
-      "                                                                                \r"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 0] Global seed set to 552501025\r\n",
-      "initializing deepspeed distributed: GLOBAL_RANK: 0, MEMBER: 1/8\r\n",
-      "[2023-08-31 22:01:31,791] [WARNING] [comm.py:152:init_deepspeed_backend] NCCL backend in DeepSpeed not yet implemented\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Enabling DeepSpeed BF16.\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "LOCAL_RANK: 7 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]\r\n",
-      "LOCAL_RANK: 2 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]\r\n",
-      "LOCAL_RANK: 4 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]\r\n",
-      "LOCAL_RANK: 5 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]\r\n",
-      "LOCAL_RANK: 1 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]\r\n",
-      "LOCAL_RANK: 3 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]\r\n",
-      "LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]\r\n",
-      "LOCAL_RANK: 6 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]\r\n",
-      "#\r\n",
-      "# RWKV lighting_trainer.py important notes \r\n",
-      "# https://github.com/RWKV/RWKV-infctx-trainer \r\n",
-      "#\r\n",
-      "# - Ensure your host is not running cuda 12.0 (use either 11.8, or >=12.1), as this is known to have freeze issues\r\n",
-      "# - The terms used in wandb / the progress bar can be confusing, see the github README.md for beter clarifications\r\n",
-      "# - When resuming from checkpoint, the estimated time is inaccurate\r\n",
-      "#\r\n",
-      "\r\n",
-      "[RWKV.model] Configuring optimizer with\r\n",
-      "    - lr_init:  4.000e-04 (0.0004)\r\n",
-      "    - lr_final: 2.000e-04 (0.0002)\r\n",
-      "\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Detected CUDA files, patching ldflags\r\n",
-      "Emitting ninja build file /root/.cache/torch_extensions/py311_cu118/fused_adam/build.ninja...\r\n",
-      "Building extension module fused_adam...\r\n",
-      "Allowing ninja to set a default number of workers... (overridable by setting the environment variable MAX_JOBS=N)\r\n",
-      "ninja: no work to do.\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Loading extension module fused_adam...\r\n",
-      "Time to load fused_adam op: 0.07133364677429199 seconds\r\n",
-      "Loading extension module fused_adam...\r\n",
-      "Loading extension module fused_adam...\r\n",
-      "Loading extension module fused_adam...\r\n",
-      "Time to load fused_adam op: 0.10167789459228516 seconds\r\n",
-      "Loading extension module fused_adam...\r\n",
-      "Time to load fused_adam op: 0.1017768383026123 seconds\r\n",
-      "Time to load fused_adam op: 0.10129690170288086 seconds\r\n",
-      "Loading extension module fused_adam...\r\n",
-      "Time to load fused_adam op: 0.1013040542602539 seconds\r\n",
-      "Time to load fused_adam op: 0.10144639015197754 seconds\r\n",
-      "Loading extension module fused_adam...\r\n",
-      "Time to load fused_adam op: 0.10147547721862793 seconds\r\n",
-      "Loading extension module fused_adam...\r\n",
-      "Time to load fused_adam op: 0.10201120376586914 seconds\r\n",
-      "Loading `train_dataloader` to estimate number of stepping batches.\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Emitting ninja build file /root/.cache/torch_extensions/py311_cu118/utils/build.ninja...\r\n",
-      "Building extension module utils...\r\n",
-      "Allowing ninja to set a default number of workers... (overridable by setting the environment variable MAX_JOBS=N)\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "ninja: no work to do.\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.0716085433959961 seconds\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Loading extension module utils...\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.1023414134979248 seconds\r\n",
-      "Loading extension module utils...\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.10242319107055664 seconds\r\n",
-      "Time to load utils op: 0.10249185562133789 seconds\r\n",
-      "Time to load utils op: 0.10365796089172363 seconds\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.10232424736022949 seconds\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.10280680656433105 seconds\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.10291290283203125 seconds\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Rank: 7 partition count [8, 8] and sizes[(176584448, False), (384, False)] \r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Rank: 2 partition count [8, 8] and sizes[(176584448, False), (384, False)] \r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Rank: 5 partition count [8, 8] and sizes[(176584448, False), (384, False)] \r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Rank: 4 partition count [8, 8] and sizes[(176584448, False), (384, False)] \r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Rank: 0 partition count [8, 8] and sizes[(176584448, False), (384, False)] \r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Rank: 3 partition count [8, 8] and sizes[(176584448, False), (384, False)] \r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Rank: 1 partition count [8, 8] and sizes[(176584448, False), (384, False)] \r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Rank: 6 partition count [8, 8] and sizes[(176584448, False), (384, False)] \r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "No modifications detected for re-loaded extension module utils, skipping build step...\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.0006060600280761719 seconds\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "No modifications detected for re-loaded extension module utils, skipping build step...\r\n",
-      "Loading extension module utils...\r\n",
-      "No modifications detected for re-loaded extension module utils, skipping build step...\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.0006058216094970703 seconds\r\n",
-      "Time to load utils op: 0.0006122589111328125 seconds\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "No modifications detected for re-loaded extension module utils, skipping build step...\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.0006463527679443359 seconds\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "No modifications detected for re-loaded extension module utils, skipping build step...\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.000640869140625 seconds\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "No modifications detected for re-loaded extension module utils, skipping build step...\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.0006463527679443359 seconds\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "No modifications detected for re-loaded extension module utils, skipping build step...\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.0006933212280273438 seconds\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "No modifications detected for re-loaded extension module utils, skipping build step...\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.0008387565612792969 seconds\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "  | Name   | Type       | Params\r\n",
-      "--------------------------------------\r\n",
-      "0 | emb    | Embedding  | 51.5 M\r\n",
-      "1 | blocks | ModuleList | 1.3 B \r\n",
-      "2 | ln_out | LayerNorm  | 2.0 K \r\n",
-      "3 | head   | Linear     | 51.5 M\r\n",
-      "--------------------------------------\r\n",
-      "1.4 B     Trainable params\r\n",
-      "0         Non-trainable params\r\n",
-      "1.4 B     Total params\r\n",
-      "5,650.715 Total estimated model params size (MB)\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Training: 0it [00:00, ?it/s]\r",
-      "Training:   0%|                                       | 0/15526 [00:00<?, ?it/s]\r",
-      "Epoch 0:   0%|                                        | 0/15526 [00:00<?, ?it/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%|                             | 1/15526 [00:07<32:29:38,  7.53s/it]\r",
-      "Epoch 0:   0%| | 1/15526 [00:07<32:29:57,  7.54s/it, v_num=73vx, train/loss=0.06"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 2/15526 [00:09<20:01:58,  4.65s/it, v_num=73vx, train/loss=0.06\r",
-      "Epoch 0:   0%| | 2/15526 [00:09<20:02:05,  4.65s/it, v_num=73vx, train/loss=0.82"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 3/15526 [00:11<16:50:05,  3.90s/it, v_num=73vx, train/loss=0.82\r",
-      "Epoch 0:   0%| | 3/15526 [00:11<16:50:08,  3.90s/it, v_num=73vx, train/loss=1.52"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 4/15526 [00:13<14:08:25,  3.28s/it, v_num=73vx, train/loss=1.52\r",
-      "Epoch 0:   0%| | 4/15526 [00:13<14:08:28,  3.28s/it, v_num=73vx, train/loss=0.27"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 5/15526 [00:14<12:31:53,  2.91s/it, v_num=73vx, train/loss=0.27\r",
-      "Epoch 0:   0%| | 5/15526 [00:14<12:31:54,  2.91s/it, v_num=73vx, train/loss=0.01"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 6/15526 [00:15<11:18:11,  2.62s/it, v_num=73vx, train/loss=0.01\r",
-      "Epoch 0:   0%| | 6/15526 [00:15<11:18:13,  2.62s/it, v_num=73vx, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 7/15526 [00:17<10:35:31,  2.46s/it, v_num=73vx, train/loss=0.00\r",
-      "Epoch 0:   0%| | 7/15526 [00:17<10:35:32,  2.46s/it, v_num=73vx, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 8/15526 [00:18<10:01:50,  2.33s/it, v_num=73vx, train/loss=0.00\r",
-      "Epoch 0:   0%| | 8/15526 [00:18<10:01:51,  2.33s/it, v_num=73vx, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 9/15526 [00:19<9:13:56,  2.14s/it, v_num=73vx, train/loss=0.002\r",
-      "Epoch 0:   0%| | 9/15526 [00:19<9:13:57,  2.14s/it, v_num=73vx, train/loss=0.000"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 10/15526 [00:19<8:35:58,  2.00s/it, v_num=73vx, train/loss=0.00\r",
-      "Epoch 0:   0%| | 10/15526 [00:19<8:35:59,  2.00s/it, v_num=73vx, train/loss=0.91"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 11/15526 [00:21<8:34:09,  1.99s/it, v_num=73vx, train/loss=0.91\r",
-      "Epoch 0:   0%| | 11/15526 [00:21<8:34:10,  1.99s/it, v_num=73vx, train/loss=4.19"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 12/15526 [00:22<8:05:58,  1.88s/it, v_num=73vx, train/loss=4.19\r",
-      "Epoch 0:   0%| | 12/15526 [00:22<8:05:59,  1.88s/it, v_num=73vx, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 13/15526 [00:23<7:41:53,  1.79s/it, v_num=73vx, train/loss=0.00\r",
-      "Epoch 0:   0%| | 13/15526 [00:23<7:41:54,  1.79s/it, v_num=73vx, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 14/15526 [00:23<7:21:43,  1.71s/it, v_num=73vx, train/loss=0.00\r",
-      "Epoch 0:   0%| | 14/15526 [00:23<7:21:44,  1.71s/it, v_num=73vx, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 15/15526 [00:24<7:04:05,  1.64s/it, v_num=73vx, train/loss=0.00\r",
-      "Epoch 0:   0%| | 15/15526 [00:24<7:04:06,  1.64s/it, v_num=73vx, train/loss=0.87"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 16/15526 [00:25<6:48:26,  1.58s/it, v_num=73vx, train/loss=0.87\r",
-      "Epoch 0:   0%| | 16/15526 [00:25<6:48:27,  1.58s/it, v_num=73vx, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 17/15526 [00:26<6:42:49,  1.56s/it, v_num=73vx, train/loss=0.00\r",
-      "Epoch 0:   0%| | 17/15526 [00:26<6:42:49,  1.56s/it, v_num=73vx, train/loss=1.54"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 18/15526 [00:27<6:37:33,  1.54s/it, v_num=73vx, train/loss=1.54\r",
-      "Epoch 0:   0%| | 18/15526 [00:27<6:37:33,  1.54s/it, v_num=73vx, train/loss=3.28"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 19/15526 [00:28<6:33:07,  1.52s/it, v_num=73vx, train/loss=3.28\r",
-      "Epoch 0:   0%| | 19/15526 [00:28<6:33:07,  1.52s/it, v_num=73vx, train/loss=1.39"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 20/15526 [00:30<6:28:50,  1.50s/it, v_num=73vx, train/loss=1.39\r",
-      "Epoch 0:   0%| | 20/15526 [00:30<6:28:50,  1.50s/it, v_num=73vx, train/loss=1.62"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 21/15526 [00:31<6:25:02,  1.49s/it, v_num=73vx, train/loss=1.62\r",
-      "Epoch 0:   0%| | 21/15526 [00:31<6:25:02,  1.49s/it, v_num=73vx, train/loss=2.03"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 22/15526 [00:31<6:15:18,  1.45s/it, v_num=73vx, train/loss=2.03\r",
-      "Epoch 0:   0%| | 22/15526 [00:31<6:15:18,  1.45s/it, v_num=73vx, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 23/15526 [00:32<6:06:25,  1.42s/it, v_num=73vx, train/loss=0.00\r",
-      "Epoch 0:   0%| | 23/15526 [00:32<6:06:25,  1.42s/it, v_num=73vx, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 24/15526 [00:33<5:58:32,  1.39s/it, v_num=73vx, train/loss=0.00\r",
-      "Epoch 0:   0%| | 24/15526 [00:33<5:58:32,  1.39s/it, v_num=73vx, train/loss=0.10"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 25/15526 [00:34<5:56:22,  1.38s/it, v_num=73vx, train/loss=0.10\r",
-      "Epoch 0:   0%| | 25/15526 [00:34<5:56:22,  1.38s/it, v_num=73vx, train/loss=2.67"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 26/15526 [00:35<5:49:18,  1.35s/it, v_num=73vx, train/loss=2.67\r",
-      "Epoch 0:   0%| | 26/15526 [00:35<5:49:19,  1.35s/it, v_num=73vx, train/loss=0.80"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 27/15526 [00:36<5:47:30,  1.35s/it, v_num=73vx, train/loss=0.80\r",
-      "Epoch 0:   0%| | 27/15526 [00:36<5:47:30,  1.35s/it, v_num=73vx, train/loss=2.33"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 28/15526 [00:36<5:41:06,  1.32s/it, v_num=73vx, train/loss=2.33\r",
-      "Epoch 0:   0%| | 28/15526 [00:36<5:41:06,  1.32s/it, v_num=73vx, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 29/15526 [00:38<5:39:43,  1.32s/it, v_num=73vx, train/loss=0.00\r",
-      "Epoch 0:   0%| | 29/15526 [00:38<5:39:44,  1.32s/it, v_num=73vx, train/loss=1.22"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 30/15526 [00:39<5:38:24,  1.31s/it, v_num=73vx, train/loss=1.22\r",
-      "Epoch 0:   0%| | 30/15526 [00:39<5:38:24,  1.31s/it, v_num=73vx, train/loss=2.78"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 31/15526 [00:39<5:32:55,  1.29s/it, v_num=73vx, train/loss=2.78\r",
-      "Epoch 0:   0%| | 31/15526 [00:39<5:32:55,  1.29s/it, v_num=73vx, train/loss=0.07"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 32/15526 [00:46<6:11:16,  1.44s/it, v_num=73vx, train/loss=0.07"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 32/15526 [00:48<6:32:56,  1.52s/it, v_num=73vx, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 33/15526 [00:49<6:26:04,  1.50s/it, v_num=73vx, train/loss=0.00\r",
-      "Epoch 0:   0%| | 33/15526 [00:49<6:26:04,  1.50s/it, v_num=73vx, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 34/15526 [00:50<6:23:28,  1.49s/it, v_num=73vx, train/loss=0.00\r",
-      "Epoch 0:   0%| | 34/15526 [00:50<6:23:29,  1.49s/it, v_num=73vx, train/loss=6.72"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 35/15526 [00:51<6:17:28,  1.46s/it, v_num=73vx, train/loss=6.72\r",
-      "Epoch 0:   0%| | 35/15526 [00:51<6:17:28,  1.46s/it, v_num=73vx, train/loss=3.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 36/15526 [00:52<6:15:23,  1.45s/it, v_num=73vx, train/loss=3.00\r",
-      "Epoch 0:   0%| | 36/15526 [00:52<6:15:24,  1.45s/it, v_num=73vx, train/loss=6.97"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 37/15526 [00:53<6:09:49,  1.43s/it, v_num=73vx, train/loss=6.97\r",
-      "Epoch 0:   0%| | 37/15526 [00:53<6:09:50,  1.43s/it, v_num=73vx, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 38/15526 [00:54<6:07:58,  1.43s/it, v_num=73vx, train/loss=0.00\r",
-      "Epoch 0:   0%| | 38/15526 [00:54<6:07:58,  1.43s/it, v_num=73vx, train/loss=6.62"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 39/15526 [00:54<6:02:55,  1.41s/it, v_num=73vx, train/loss=6.62\r",
-      "Epoch 0:   0%| | 39/15526 [00:54<6:02:56,  1.41s/it, v_num=73vx, train/loss=5.25"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 40/15526 [00:55<5:58:03,  1.39s/it, v_num=73vx, train/loss=5.25\r",
-      "Epoch 0:   0%| | 40/15526 [00:55<5:58:03,  1.39s/it, v_num=73vx, train/loss=2.31"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 41/15526 [00:56<5:53:27,  1.37s/it, v_num=73vx, train/loss=2.31\r",
-      "Epoch 0:   0%| | 41/15526 [00:56<5:53:28,  1.37s/it, v_num=73vx, train/loss=4.78"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 42/15526 [00:56<5:49:01,  1.35s/it, v_num=73vx, train/loss=4.78\r",
-      "Epoch 0:   0%| | 42/15526 [00:56<5:49:01,  1.35s/it, v_num=73vx, train/loss=0.08"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 43/15526 [00:57<5:44:47,  1.34s/it, v_num=73vx, train/loss=0.08\r",
-      "Epoch 0:   0%| | 43/15526 [00:57<5:44:47,  1.34s/it, v_num=73vx, train/loss=0.05"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 44/15526 [00:58<5:40:46,  1.32s/it, v_num=73vx, train/loss=0.05\r",
-      "Epoch 0:   0%| | 44/15526 [00:58<5:40:46,  1.32s/it, v_num=73vx, train/loss=2.30"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 45/15526 [00:59<5:39:53,  1.32s/it, v_num=73vx, train/loss=2.30\r",
-      "Epoch 0:   0%| | 45/15526 [00:59<5:39:53,  1.32s/it, v_num=73vx, train/loss=7.16"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 46/15526 [01:00<5:38:56,  1.31s/it, v_num=73vx, train/loss=7.16\r",
-      "Epoch 0:   0%| | 46/15526 [01:00<5:38:56,  1.31s/it, v_num=73vx, train/loss=6.97"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 47/15526 [01:01<5:38:00,  1.31s/it, v_num=73vx, train/loss=6.97\r",
-      "Epoch 0:   0%| | 47/15526 [01:01<5:38:01,  1.31s/it, v_num=73vx, train/loss=7.03"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 48/15526 [01:02<5:34:26,  1.30s/it, v_num=73vx, train/loss=7.03\r",
-      "Epoch 0:   0%| | 48/15526 [01:02<5:34:26,  1.30s/it, v_num=73vx, train/loss=0.21"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 49/15526 [01:02<5:31:01,  1.28s/it, v_num=73vx, train/loss=0.21\r",
-      "Epoch 0:   0%| | 49/15526 [01:02<5:31:01,  1.28s/it, v_num=73vx, train/loss=0.56"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 50/15526 [01:04<5:30:15,  1.28s/it, v_num=73vx, train/loss=0.56\r",
-      "Epoch 0:   0%| | 50/15526 [01:04<5:30:16,  1.28s/it, v_num=73vx, train/loss=6.38"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 51/15526 [01:05<5:29:32,  1.28s/it, v_num=73vx, train/loss=6.38\r",
-      "Epoch 0:   0%| | 51/15526 [01:05<5:29:33,  1.28s/it, v_num=73vx, train/loss=5.69"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 52/15526 [01:05<5:26:24,  1.27s/it, v_num=73vx, train/loss=5.69\r",
-      "Epoch 0:   0%| | 52/15526 [01:05<5:26:24,  1.27s/it, v_num=73vx, train/loss=2.47"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 53/15526 [01:06<5:25:55,  1.26s/it, v_num=73vx, train/loss=2.47\r",
-      "Epoch 0:   0%| | 53/15526 [01:06<5:25:55,  1.26s/it, v_num=73vx, train/loss=7.22"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 54/15526 [01:08<5:25:23,  1.26s/it, v_num=73vx, train/loss=7.22\r",
-      "Epoch 0:   0%| | 54/15526 [01:08<5:25:23,  1.26s/it, v_num=73vx, train/loss=6.69"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 55/15526 [01:08<5:22:28,  1.25s/it, v_num=73vx, train/loss=6.69\r",
-      "Epoch 0:   0%| | 55/15526 [01:08<5:22:28,  1.25s/it, v_num=73vx, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 56/15526 [01:09<5:22:02,  1.25s/it, v_num=73vx, train/loss=0.00\r",
-      "Epoch 0:   0%| | 56/15526 [01:09<5:22:02,  1.25s/it, v_num=73vx, train/loss=7.31"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 57/15526 [01:10<5:19:16,  1.24s/it, v_num=73vx, train/loss=7.31"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 57/15526 [01:10<5:19:17,  1.24s/it, v_num=73vx, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 58/15526 [01:11<5:16:38,  1.23s/it, v_num=73vx, train/loss=0.00\r",
-      "Epoch 0:   0%| | 58/15526 [01:11<5:16:38,  1.23s/it, v_num=73vx, train/loss=0.04"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 59/15526 [01:11<5:14:05,  1.22s/it, v_num=73vx, train/loss=0.04\r",
-      "Epoch 0:   0%| | 59/15526 [01:11<5:14:05,  1.22s/it, v_num=73vx, train/loss=1.54"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 60/15526 [01:13<5:13:50,  1.22s/it, v_num=73vx, train/loss=1.54\r",
-      "Epoch 0:   0%| | 60/15526 [01:13<5:13:50,  1.22s/it, v_num=73vx, train/loss=7.22"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 61/15526 [01:13<5:11:26,  1.21s/it, v_num=73vx, train/loss=7.22\r",
-      "Epoch 0:   0%| | 61/15526 [01:13<5:11:26,  1.21s/it, v_num=73vx, train/loss=3.73"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 62/15526 [01:14<5:11:11,  1.21s/it, v_num=73vx, train/loss=3.73\r",
-      "Epoch 0:   0%| | 62/15526 [01:14<5:11:11,  1.21s/it, v_num=73vx, train/loss=7.03"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 63/15526 [01:16<5:10:56,  1.21s/it, v_num=73vx, train/loss=7.03\r",
-      "Epoch 0:   0%| | 63/15526 [01:16<5:10:56,  1.21s/it, v_num=73vx, train/loss=6.81"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 64/15526 [01:20<5:25:41,  1.26s/it, v_num=73vx, train/loss=6.81"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 64/15526 [01:23<5:36:35,  1.31s/it, v_num=73vx, train/loss=4.84"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 65/15526 [01:24<5:33:57,  1.30s/it, v_num=73vx, train/loss=4.84\r",
-      "Epoch 0:   0%| | 65/15526 [01:24<5:33:57,  1.30s/it, v_num=73vx, train/loss=3.47"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 66/15526 [01:24<5:31:24,  1.29s/it, v_num=73vx, train/loss=3.47\r",
-      "Epoch 0:   0%| | 66/15526 [01:24<5:31:24,  1.29s/it, v_num=73vx, train/loss=0.23"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 67/15526 [01:25<5:28:53,  1.28s/it, v_num=73vx, train/loss=0.23\r",
-      "Epoch 0:   0%| | 67/15526 [01:25<5:28:54,  1.28s/it, v_num=73vx, train/loss=0.03"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 68/15526 [01:26<5:26:31,  1.27s/it, v_num=73vx, train/loss=0.03\r",
-      "Epoch 0:   0%| | 68/15526 [01:26<5:26:32,  1.27s/it, v_num=73vx, train/loss=2.36"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 69/15526 [01:27<5:26:14,  1.27s/it, v_num=73vx, train/loss=2.36\r",
-      "Epoch 0:   0%| | 69/15526 [01:27<5:26:14,  1.27s/it, v_num=73vx, train/loss=6.88"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 70/15526 [01:28<5:24:02,  1.26s/it, v_num=73vx, train/loss=6.88\r",
-      "Epoch 0:   0%| | 70/15526 [01:28<5:24:02,  1.26s/it, v_num=73vx, train/loss=3.06"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 71/15526 [01:28<5:21:57,  1.25s/it, v_num=73vx, train/loss=3.06\r",
-      "Epoch 0:   0%| | 71/15526 [01:28<5:21:57,  1.25s/it, v_num=73vx, train/loss=1.65"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 72/15526 [01:29<5:21:46,  1.25s/it, v_num=73vx, train/loss=1.65\r",
-      "Epoch 0:   0%| | 72/15526 [01:29<5:21:46,  1.25s/it, v_num=73vx, train/loss=5.69"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 73/15526 [01:31<5:21:35,  1.25s/it, v_num=73vx, train/loss=5.69\r",
-      "Epoch 0:   0%| | 73/15526 [01:31<5:21:36,  1.25s/it, v_num=73vx, train/loss=5.31"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 74/15526 [01:32<5:21:25,  1.25s/it, v_num=73vx, train/loss=5.31\r",
-      "Epoch 0:   0%| | 74/15526 [01:32<5:21:25,  1.25s/it, v_num=73vx, train/loss=7.12"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 75/15526 [01:33<5:21:51,  1.25s/it, v_num=73vx, train/loss=7.12\r",
-      "Epoch 0:   0%| | 75/15526 [01:33<5:21:51,  1.25s/it, v_num=73vx, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 76/15526 [01:34<5:21:38,  1.25s/it, v_num=73vx, train/loss=0.00\r",
-      "Epoch 0:   0%| | 76/15526 [01:34<5:21:38,  1.25s/it, v_num=73vx, train/loss=5.56"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 77/15526 [01:35<5:19:40,  1.24s/it, v_num=73vx, train/loss=5.56\r",
-      "Epoch 0:   0%| | 77/15526 [01:35<5:19:41,  1.24s/it, v_num=73vx, train/loss=0.96"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 78/15526 [01:36<5:17:45,  1.23s/it, v_num=73vx, train/loss=0.96\r",
-      "Epoch 0:   1%| | 78/15526 [01:36<5:17:45,  1.23s/it, v_num=73vx, train/loss=0.44"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 79/15526 [01:36<5:15:52,  1.23s/it, v_num=73vx, train/loss=0.44\r",
-      "Epoch 0:   1%| | 79/15526 [01:36<5:15:53,  1.23s/it, v_num=73vx, train/loss=0.75"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 80/15526 [01:38<5:15:47,  1.23s/it, v_num=73vx, train/loss=0.75\r",
-      "Epoch 0:   1%| | 80/15526 [01:38<5:15:48,  1.23s/it, v_num=73vx, train/loss=6.50"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 81/15526 [01:40<5:20:41,  1.25s/it, v_num=73vx, train/loss=6.50\r",
-      "Epoch 0:   1%| | 81/15526 [01:40<5:20:41,  1.25s/it, v_num=73vx, train/loss=3.83"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 82/15526 [01:41<5:18:55,  1.24s/it, v_num=73vx, train/loss=3.83\r",
-      "Epoch 0:   1%| | 82/15526 [01:41<5:18:55,  1.24s/it, v_num=73vx, train/loss=0.53"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 83/15526 [01:42<5:17:08,  1.23s/it, v_num=73vx, train/loss=0.53\r",
-      "Epoch 0:   1%| | 83/15526 [01:42<5:17:08,  1.23s/it, v_num=73vx, train/loss=0.94"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 84/15526 [01:42<5:15:25,  1.23s/it, v_num=73vx, train/loss=0.94\r",
-      "Epoch 0:   1%| | 84/15526 [01:42<5:15:25,  1.23s/it, v_num=73vx, train/loss=0.26"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 85/15526 [01:43<5:13:44,  1.22s/it, v_num=73vx, train/loss=0.26\r",
-      "Epoch 0:   1%| | 85/15526 [01:43<5:13:44,  1.22s/it, v_num=73vx, train/loss=1.65"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 86/15526 [01:44<5:13:37,  1.22s/it, v_num=73vx, train/loss=1.65\r",
-      "Epoch 0:   1%| | 86/15526 [01:44<5:13:37,  1.22s/it, v_num=73vx, train/loss=6.25"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 87/15526 [01:45<5:11:59,  1.21s/it, v_num=73vx, train/loss=6.25\r",
-      "Epoch 0:   1%| | 87/15526 [01:45<5:11:59,  1.21s/it, v_num=73vx, train/loss=2.61"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 88/15526 [01:46<5:11:54,  1.21s/it, v_num=73vx, train/loss=2.61\r",
-      "Epoch 0:   1%| | 88/15526 [01:46<5:11:54,  1.21s/it, v_num=73vx, train/loss=7.16"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 89/15526 [01:47<5:10:18,  1.21s/it, v_num=73vx, train/loss=7.16\r",
-      "Epoch 0:   1%| | 89/15526 [01:47<5:10:18,  1.21s/it, v_num=73vx, train/loss=0.20"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 90/15526 [01:48<5:08:46,  1.20s/it, v_num=73vx, train/loss=0.20\r",
-      "Epoch 0:   1%| | 90/15526 [01:48<5:08:46,  1.20s/it, v_num=73vx, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 91/15526 [01:48<5:07:15,  1.19s/it, v_num=73vx, train/loss=0.00\r",
-      "Epoch 0:   1%| | 91/15526 [01:48<5:07:15,  1.19s/it, v_num=73vx, train/loss=0.22"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 92/15526 [01:49<5:07:12,  1.19s/it, v_num=73vx, train/loss=0.22\r",
-      "Epoch 0:   1%| | 92/15526 [01:49<5:07:12,  1.19s/it, v_num=73vx, train/loss=4.78"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 93/15526 [01:51<5:07:09,  1.19s/it, v_num=73vx, train/loss=4.78\r",
-      "Epoch 0:   1%| | 93/15526 [01:51<5:07:09,  1.19s/it, v_num=73vx, train/loss=4.72"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 94/15526 [01:52<5:07:09,  1.19s/it, v_num=73vx, train/loss=4.72\r",
-      "Epoch 0:   1%| | 94/15526 [01:52<5:07:10,  1.19s/it, v_num=73vx, train/loss=6.25"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 95/15526 [01:52<5:05:43,  1.19s/it, v_num=73vx, train/loss=6.25\r",
-      "Epoch 0:   1%| | 95/15526 [01:52<5:05:44,  1.19s/it, v_num=73vx, train/loss=0.07"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 96/15526 [01:59<5:19:45,  1.24s/it, v_num=73vx, train/loss=0.07\r",
-      "Epoch 0:   1%| | 96/15526 [01:59<5:19:45,  1.24s/it, v_num=73vx, train/loss=6.62"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 97/15526 [02:00<5:18:11,  1.24s/it, v_num=73vx, train/loss=6.62\r",
-      "Epoch 0:   1%| | 97/15526 [02:00<5:18:11,  1.24s/it, v_num=73vx, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 98/15526 [02:01<5:18:03,  1.24s/it, v_num=73vx, train/loss=0.00\r",
-      "Epoch 0:   1%| | 98/15526 [02:01<5:18:03,  1.24s/it, v_num=73vx, train/loss=4.94"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 99/15526 [02:01<5:16:34,  1.23s/it, v_num=73vx, train/loss=4.94\r",
-      "Epoch 0:   1%| | 99/15526 [02:01<5:16:34,  1.23s/it, v_num=73vx, train/loss=1.50"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 100/15526 [02:02<5:15:05,  1.23s/it, v_num=73vx, train/loss=1.5\r",
-      "Epoch 0:   1%| | 100/15526 [02:02<5:15:05,  1.23s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 101/15526 [02:03<5:15:03,  1.23s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 101/15526 [02:03<5:15:03,  1.23s/it, v_num=73vx, train/loss=5.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 102/15526 [02:04<5:15:00,  1.23s/it, v_num=73vx, train/loss=5.3\r",
-      "Epoch 0:   1%| | 102/15526 [02:04<5:15:00,  1.23s/it, v_num=73vx, train/loss=5.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 103/15526 [02:05<5:13:37,  1.22s/it, v_num=73vx, train/loss=5.4\r",
-      "Epoch 0:   1%| | 103/15526 [02:05<5:13:37,  1.22s/it, v_num=73vx, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 104/15526 [02:06<5:12:15,  1.21s/it, v_num=73vx, train/loss=2.0\r",
-      "Epoch 0:   1%| | 104/15526 [02:06<5:12:15,  1.21s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 105/15526 [02:07<5:10:56,  1.21s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   1%| | 105/15526 [02:07<5:10:56,  1.21s/it, v_num=73vx, train/loss=2.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 106/15526 [02:07<5:09:40,  1.20s/it, v_num=73vx, train/loss=2.6\r",
-      "Epoch 0:   1%| | 106/15526 [02:07<5:09:40,  1.20s/it, v_num=73vx, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 107/15526 [02:08<5:09:41,  1.21s/it, v_num=73vx, train/loss=3.3\r",
-      "Epoch 0:   1%| | 107/15526 [02:08<5:09:41,  1.21s/it, v_num=73vx, train/loss=6.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 108/15526 [02:10<5:09:44,  1.21s/it, v_num=73vx, train/loss=6.2\r",
-      "Epoch 0:   1%| | 108/15526 [02:10<5:09:44,  1.21s/it, v_num=73vx, train/loss=5.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 109/15526 [02:11<5:09:43,  1.21s/it, v_num=73vx, train/loss=5.9\r",
-      "Epoch 0:   1%| | 109/15526 [02:11<5:09:43,  1.21s/it, v_num=73vx, train/loss=5.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 110/15526 [02:12<5:09:42,  1.21s/it, v_num=73vx, train/loss=5.4\r",
-      "Epoch 0:   1%| | 110/15526 [02:12<5:09:42,  1.21s/it, v_num=73vx, train/loss=6.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 111/15526 [02:13<5:08:26,  1.20s/it, v_num=73vx, train/loss=6.0\r",
-      "Epoch 0:   1%| | 111/15526 [02:13<5:08:26,  1.20s/it, v_num=73vx, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 112/15526 [02:13<5:07:12,  1.20s/it, v_num=73vx, train/loss=1.5\r",
-      "Epoch 0:   1%| | 112/15526 [02:13<5:07:13,  1.20s/it, v_num=73vx, train/loss=2.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 113/15526 [02:14<5:05:58,  1.19s/it, v_num=73vx, train/loss=2.4\r",
-      "Epoch 0:   1%| | 113/15526 [02:14<5:05:59,  1.19s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 114/15526 [02:15<5:04:47,  1.19s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 114/15526 [02:15<5:04:47,  1.19s/it, v_num=73vx, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 115/15526 [02:15<5:03:36,  1.18s/it, v_num=73vx, train/loss=3.5\r",
-      "Epoch 0:   1%| | 115/15526 [02:15<5:03:36,  1.18s/it, v_num=73vx, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 116/15526 [02:16<5:02:26,  1.18s/it, v_num=73vx, train/loss=1.4\r",
-      "Epoch 0:   1%| | 116/15526 [02:16<5:02:27,  1.18s/it, v_num=73vx, train/loss=3.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 117/15526 [02:17<5:01:18,  1.17s/it, v_num=73vx, train/loss=3.9\r",
-      "Epoch 0:   1%| | 117/15526 [02:17<5:01:18,  1.17s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 118/15526 [02:17<5:00:11,  1.17s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 118/15526 [02:17<5:00:11,  1.17s/it, v_num=73vx, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 119/15526 [02:19<5:00:11,  1.17s/it, v_num=73vx, train/loss=2.0\r",
-      "Epoch 0:   1%| | 119/15526 [02:19<5:00:11,  1.17s/it, v_num=73vx, train/loss=5.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 120/15526 [02:20<5:00:15,  1.17s/it, v_num=73vx, train/loss=5.7\r",
-      "Epoch 0:   1%| | 120/15526 [02:20<5:00:15,  1.17s/it, v_num=73vx, train/loss=4.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 121/15526 [02:21<5:00:14,  1.17s/it, v_num=73vx, train/loss=4.1\r",
-      "Epoch 0:   1%| | 121/15526 [02:21<5:00:14,  1.17s/it, v_num=73vx, train/loss=6.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 122/15526 [02:22<4:59:10,  1.17s/it, v_num=73vx, train/loss=6.3\r",
-      "Epoch 0:   1%| | 122/15526 [02:22<4:59:10,  1.17s/it, v_num=73vx, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 123/15526 [02:22<4:58:06,  1.16s/it, v_num=73vx, train/loss=1.9\r",
-      "Epoch 0:   1%| | 123/15526 [02:22<4:58:06,  1.16s/it, v_num=73vx, train/loss=3.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 124/15526 [02:23<4:57:03,  1.16s/it, v_num=73vx, train/loss=3.7\r",
-      "Epoch 0:   1%| | 124/15526 [02:23<4:57:03,  1.16s/it, v_num=73vx, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 125/15526 [02:24<4:55:59,  1.15s/it, v_num=73vx, train/loss=0.6\r",
-      "Epoch 0:   1%| | 125/15526 [02:24<4:55:59,  1.15s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 126/15526 [02:25<4:56:31,  1.16s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   1%| | 126/15526 [02:25<4:56:31,  1.16s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 127/15526 [02:26<4:56:30,  1.16s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 127/15526 [02:26<4:56:31,  1.16s/it, v_num=73vx, train/loss=5.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 128/15526 [02:35<5:12:05,  1.22s/it, v_num=73vx, train/loss=5.5\r",
-      "Epoch 0:   1%| | 128/15526 [02:35<5:12:05,  1.22s/it, v_num=73vx, train/loss=5.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 129/15526 [02:36<5:10:56,  1.21s/it, v_num=73vx, train/loss=5.8\r",
-      "Epoch 0:   1%| | 129/15526 [02:36<5:10:56,  1.21s/it, v_num=73vx, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 130/15526 [02:37<5:10:49,  1.21s/it, v_num=73vx, train/loss=1.2\r",
-      "Epoch 0:   1%| | 130/15526 [02:37<5:10:49,  1.21s/it, v_num=73vx, train/loss=4.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 131/15526 [02:38<5:09:44,  1.21s/it, v_num=73vx, train/loss=4.8\r",
-      "Epoch 0:   1%| | 131/15526 [02:38<5:09:44,  1.21s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 132/15526 [02:39<5:09:41,  1.21s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 132/15526 [02:39<5:09:41,  1.21s/it, v_num=73vx, train/loss=4.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 133/15526 [02:40<5:08:39,  1.20s/it, v_num=73vx, train/loss=4.5\r",
-      "Epoch 0:   1%| | 133/15526 [02:40<5:08:39,  1.20s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 134/15526 [02:40<5:07:37,  1.20s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 134/15526 [02:40<5:07:37,  1.20s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 135/15526 [02:41<5:06:37,  1.20s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 135/15526 [02:41<5:06:37,  1.20s/it, v_num=73vx, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 136/15526 [02:42<5:06:39,  1.20s/it, v_num=73vx, train/loss=1.7\r",
-      "Epoch 0:   1%| | 136/15526 [02:42<5:06:39,  1.20s/it, v_num=73vx, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 137/15526 [02:43<5:05:41,  1.19s/it, v_num=73vx, train/loss=3.5\r",
-      "Epoch 0:   1%| | 137/15526 [02:43<5:05:41,  1.19s/it, v_num=73vx, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 138/15526 [02:44<5:05:43,  1.19s/it, v_num=73vx, train/loss=1.2\r",
-      "Epoch 0:   1%| | 138/15526 [02:44<5:05:43,  1.19s/it, v_num=73vx, train/loss=6.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 139/15526 [02:45<5:05:43,  1.19s/it, v_num=73vx, train/loss=6.1\r",
-      "Epoch 0:   1%| | 139/15526 [02:45<5:05:43,  1.19s/it, v_num=73vx, train/loss=3.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 140/15526 [02:46<5:04:46,  1.19s/it, v_num=73vx, train/loss=3.4\r",
-      "Epoch 0:   1%| | 140/15526 [02:46<5:04:46,  1.19s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 141/15526 [02:47<5:03:48,  1.18s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 141/15526 [02:47<5:03:48,  1.18s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 142/15526 [02:47<5:02:52,  1.18s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 142/15526 [02:47<5:02:52,  1.18s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 143/15526 [02:48<5:02:54,  1.18s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 143/15526 [02:48<5:02:54,  1.18s/it, v_num=73vx, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 144/15526 [02:50<5:02:57,  1.18s/it, v_num=73vx, train/loss=3.1\r",
-      "Epoch 0:   1%| | 144/15526 [02:50<5:02:58,  1.18s/it, v_num=73vx, train/loss=5.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 145/15526 [02:51<5:02:59,  1.18s/it, v_num=73vx, train/loss=5.2\r",
-      "Epoch 0:   1%| | 145/15526 [02:51<5:03:00,  1.18s/it, v_num=73vx, train/loss=4.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 146/15526 [02:52<5:02:05,  1.18s/it, v_num=73vx, train/loss=4.5\r",
-      "Epoch 0:   1%| | 146/15526 [02:52<5:02:05,  1.18s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 147/15526 [02:52<5:01:13,  1.18s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 147/15526 [02:52<5:01:13,  1.18s/it, v_num=73vx, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 148/15526 [02:53<5:00:21,  1.17s/it, v_num=73vx, train/loss=1.6\r",
-      "Epoch 0:   1%| | 148/15526 [02:53<5:00:21,  1.17s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 149/15526 [02:54<5:00:27,  1.17s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 149/15526 [02:54<5:00:27,  1.17s/it, v_num=73vx, train/loss=3.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 150/15526 [02:55<4:59:35,  1.17s/it, v_num=73vx, train/loss=3.9\r",
-      "Epoch 0:   1%| | 150/15526 [02:55<4:59:35,  1.17s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 151/15526 [02:56<4:59:37,  1.17s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 151/15526 [02:56<4:59:37,  1.17s/it, v_num=73vx, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 152/15526 [02:57<4:58:50,  1.17s/it, v_num=73vx, train/loss=3.5\r",
-      "Epoch 0:   1%| | 152/15526 [02:57<4:58:50,  1.17s/it, v_num=73vx, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 153/15526 [02:58<4:58:54,  1.17s/it, v_num=73vx, train/loss=1.7\r",
-      "Epoch 0:   1%| | 153/15526 [02:58<4:58:55,  1.17s/it, v_num=73vx, train/loss=5.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 154/15526 [02:59<4:58:03,  1.16s/it, v_num=73vx, train/loss=5.3\r",
-      "Epoch 0:   1%| | 154/15526 [02:59<4:58:03,  1.16s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 155/15526 [02:59<4:57:14,  1.16s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 155/15526 [02:59<4:57:14,  1.16s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 156/15526 [03:00<4:56:25,  1.16s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 156/15526 [03:00<4:56:25,  1.16s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 157/15526 [03:01<4:55:37,  1.15s/it, v_num=73vx, train/loss=0.7\r",
-      "Epoch 0:   1%| | 157/15526 [03:01<4:55:37,  1.15s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 158/15526 [03:01<4:54:50,  1.15s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 158/15526 [03:01<4:54:50,  1.15s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 159/15526 [03:02<4:54:03,  1.15s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   1%| | 159/15526 [03:02<4:54:03,  1.15s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 160/15526 [03:10<5:04:57,  1.19s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 160/15526 [03:10<5:04:57,  1.19s/it, v_num=73vx, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 161/15526 [03:11<5:04:05,  1.19s/it, v_num=73vx, train/loss=2.0\r",
-      "Epoch 0:   1%| | 161/15526 [03:11<5:04:05,  1.19s/it, v_num=73vx, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 162/15526 [03:11<5:03:14,  1.18s/it, v_num=73vx, train/loss=1.4\r",
-      "Epoch 0:   1%| | 162/15526 [03:11<5:03:14,  1.18s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 163/15526 [03:13<5:03:13,  1.18s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 163/15526 [03:13<5:03:13,  1.18s/it, v_num=73vx, train/loss=4.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 164/15526 [03:13<5:02:24,  1.18s/it, v_num=73vx, train/loss=4.3\r",
-      "Epoch 0:   1%| | 164/15526 [03:13<5:02:24,  1.18s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 165/15526 [03:14<5:02:25,  1.18s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 165/15526 [03:14<5:02:25,  1.18s/it, v_num=73vx, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 166/15526 [03:16<5:02:25,  1.18s/it, v_num=73vx, train/loss=3.5\r",
-      "Epoch 0:   1%| | 166/15526 [03:16<5:02:26,  1.18s/it, v_num=73vx, train/loss=5.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 167/15526 [03:16<5:01:36,  1.18s/it, v_num=73vx, train/loss=5.5\r",
-      "Epoch 0:   1%| | 167/15526 [03:16<5:01:37,  1.18s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 168/15526 [03:17<5:00:50,  1.18s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 168/15526 [03:17<5:00:50,  1.18s/it, v_num=73vx, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 169/15526 [03:18<5:00:51,  1.18s/it, v_num=73vx, train/loss=2.5\r",
-      "Epoch 0:   1%| | 169/15526 [03:18<5:00:51,  1.18s/it, v_num=73vx, train/loss=5.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 170/15526 [03:19<5:00:05,  1.17s/it, v_num=73vx, train/loss=5.8\r",
-      "Epoch 0:   1%| | 170/15526 [03:19<5:00:05,  1.17s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 171/15526 [03:20<4:59:19,  1.17s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 171/15526 [03:20<4:59:19,  1.17s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 172/15526 [03:20<4:58:34,  1.17s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   1%| | 172/15526 [03:20<4:58:34,  1.17s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 173/15526 [03:21<4:58:35,  1.17s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 173/15526 [03:21<4:58:35,  1.17s/it, v_num=73vx, train/loss=5.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 174/15526 [03:22<4:57:49,  1.16s/it, v_num=73vx, train/loss=5.0\r",
-      "Epoch 0:   1%| | 174/15526 [03:22<4:57:49,  1.16s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 175/15526 [03:23<4:57:05,  1.16s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 175/15526 [03:23<4:57:05,  1.16s/it, v_num=73vx, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 176/15526 [03:23<4:56:21,  1.16s/it, v_num=73vx, train/loss=0.6\r",
-      "Epoch 0:   1%| | 176/15526 [03:23<4:56:22,  1.16s/it, v_num=73vx, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 177/15526 [03:24<4:55:39,  1.16s/it, v_num=73vx, train/loss=1.5\r",
-      "Epoch 0:   1%| | 177/15526 [03:24<4:55:39,  1.16s/it, v_num=73vx, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 178/15526 [03:25<4:54:56,  1.15s/it, v_num=73vx, train/loss=1.1\r",
-      "Epoch 0:   1%| | 178/15526 [03:25<4:54:56,  1.15s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 179/15526 [03:25<4:54:14,  1.15s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 179/15526 [03:25<4:54:14,  1.15s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 180/15526 [03:26<4:53:32,  1.15s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 180/15526 [03:26<4:53:33,  1.15s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 181/15526 [03:27<4:52:51,  1.15s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 181/15526 [03:27<4:52:51,  1.15s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 182/15526 [03:28<4:52:54,  1.15s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   1%| | 182/15526 [03:28<4:52:54,  1.15s/it, v_num=73vx, train/loss=4.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 183/15526 [03:29<4:52:14,  1.14s/it, v_num=73vx, train/loss=4.5\r",
-      "Epoch 0:   1%| | 183/15526 [03:29<4:52:14,  1.14s/it, v_num=73vx, train/loss=2.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 184/15526 [03:29<4:51:34,  1.14s/it, v_num=73vx, train/loss=2.3\r",
-      "Epoch 0:   1%| | 184/15526 [03:29<4:51:34,  1.14s/it, v_num=73vx, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 185/15526 [03:30<4:50:53,  1.14s/it, v_num=73vx, train/loss=1.8\r",
-      "Epoch 0:   1%| | 185/15526 [03:30<4:50:53,  1.14s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 186/15526 [03:31<4:50:13,  1.14s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 186/15526 [03:31<4:50:14,  1.14s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 187/15526 [03:31<4:49:35,  1.13s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 187/15526 [03:31<4:49:35,  1.13s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 188/15526 [03:33<4:49:39,  1.13s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 188/15526 [03:33<4:49:40,  1.13s/it, v_num=73vx, train/loss=5.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 189/15526 [03:34<4:49:44,  1.13s/it, v_num=73vx, train/loss=5.2\r",
-      "Epoch 0:   1%| | 189/15526 [03:34<4:49:44,  1.13s/it, v_num=73vx, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 190/15526 [03:34<4:49:06,  1.13s/it, v_num=73vx, train/loss=3.3\r",
-      "Epoch 0:   1%| | 190/15526 [03:34<4:49:06,  1.13s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 191/15526 [03:35<4:48:27,  1.13s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   1%| | 191/15526 [03:35<4:48:27,  1.13s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 192/15526 [03:43<4:58:05,  1.17s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   1%| | 192/15526 [03:43<4:58:05,  1.17s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 193/15526 [03:44<4:57:24,  1.16s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   1%| | 193/15526 [03:44<4:57:24,  1.16s/it, v_num=73vx, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 194/15526 [03:45<4:56:44,  1.16s/it, v_num=73vx, train/loss=1.1\r",
-      "Epoch 0:   1%| | 194/15526 [03:45<4:56:44,  1.16s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 195/15526 [03:45<4:56:04,  1.16s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 195/15526 [03:45<4:56:04,  1.16s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 196/15526 [03:46<4:55:24,  1.16s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 196/15526 [03:46<4:55:24,  1.16s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 197/15526 [03:47<4:55:25,  1.16s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 197/15526 [03:47<4:55:25,  1.16s/it, v_num=73vx, train/loss=5.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 198/15526 [03:48<4:55:26,  1.16s/it, v_num=73vx, train/loss=5.0\r",
-      "Epoch 0:   1%| | 198/15526 [03:48<4:55:26,  1.16s/it, v_num=73vx, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 199/15526 [03:49<4:54:47,  1.15s/it, v_num=73vx, train/loss=3.5\r",
-      "Epoch 0:   1%| | 199/15526 [03:49<4:54:47,  1.15s/it, v_num=73vx, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 200/15526 [03:50<4:54:49,  1.15s/it, v_num=73vx, train/loss=1.2\r",
-      "Epoch 0:   1%| | 200/15526 [03:50<4:54:49,  1.15s/it, v_num=73vx, train/loss=3.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 201/15526 [03:51<4:54:10,  1.15s/it, v_num=73vx, train/loss=3.6\r",
-      "Epoch 0:   1%| | 201/15526 [03:51<4:54:10,  1.15s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 202/15526 [03:52<4:53:32,  1.15s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 202/15526 [03:52<4:53:32,  1.15s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 203/15526 [03:52<4:52:55,  1.15s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 203/15526 [03:52<4:52:55,  1.15s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 204/15526 [03:53<4:52:18,  1.14s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 204/15526 [03:53<4:52:18,  1.14s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 205/15526 [03:54<4:51:42,  1.14s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 205/15526 [03:54<4:51:42,  1.14s/it, v_num=73vx, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 206/15526 [03:54<4:51:06,  1.14s/it, v_num=73vx, train/loss=2.5\r",
-      "Epoch 0:   1%| | 206/15526 [03:54<4:51:07,  1.14s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 207/15526 [03:55<4:50:31,  1.14s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 207/15526 [03:55<4:50:31,  1.14s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 208/15526 [03:56<4:49:56,  1.14s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 208/15526 [03:56<4:49:56,  1.14s/it, v_num=73vx, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 209/15526 [03:57<4:49:59,  1.14s/it, v_num=73vx, train/loss=2.0\r",
-      "Epoch 0:   1%| | 209/15526 [03:57<4:49:59,  1.14s/it, v_num=73vx, train/loss=5.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 210/15526 [03:58<4:50:01,  1.14s/it, v_num=73vx, train/loss=5.3\r",
-      "Epoch 0:   1%| | 210/15526 [03:58<4:50:01,  1.14s/it, v_num=73vx, train/loss=5.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 211/15526 [03:59<4:49:26,  1.13s/it, v_num=73vx, train/loss=5.5\r",
-      "Epoch 0:   1%| | 211/15526 [03:59<4:49:26,  1.13s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 212/15526 [03:59<4:48:52,  1.13s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 212/15526 [03:59<4:48:52,  1.13s/it, v_num=73vx, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 213/15526 [04:00<4:48:18,  1.13s/it, v_num=73vx, train/loss=2.0\r",
-      "Epoch 0:   1%| | 213/15526 [04:00<4:48:18,  1.13s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 214/15526 [04:01<4:48:20,  1.13s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 214/15526 [04:01<4:48:20,  1.13s/it, v_num=73vx, train/loss=4.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 215/15526 [04:02<4:47:47,  1.13s/it, v_num=73vx, train/loss=4.2\r",
-      "Epoch 0:   1%| | 215/15526 [04:02<4:47:47,  1.13s/it, v_num=73vx, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 216/15526 [04:03<4:47:52,  1.13s/it, v_num=73vx, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 216/15526 [04:03<4:47:52,  1.13s/it, v_num=73vx, train/loss=3.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 217/15526 [04:04<4:47:54,  1.13s/it, v_num=73vx, train/loss=3.4\r",
-      "Epoch 0:   1%| | 217/15526 [04:04<4:47:54,  1.13s/it, v_num=73vx, train/loss=4.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 218/15526 [04:05<4:47:21,  1.13s/it, v_num=73vx, train/loss=4.6\r",
-      "Epoch 0:   1%| | 218/15526 [04:05<4:47:21,  1.13s/it, v_num=73vx, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 219/15526 [04:06<4:47:24,  1.13s/it, v_num=73vx, train/loss=2.1\r",
-      "Epoch 0:   1%| | 219/15526 [04:06<4:47:24,  1.13s/it, v_num=73vx, train/loss=5.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 220/15526 [04:07<4:46:51,  1.12s/it, v_num=73vx, train/loss=5.3\r",
-      "Epoch 0:   1%| | 220/15526 [04:07<4:46:51,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 221/15526 [04:08<4:46:56,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 221/15526 [04:08<4:46:56,  1.12s/it, v_num=73vx, train/loss=3.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 222/15526 [04:09<4:47:00,  1.13s/it, v_num=73vx, train/loss=3.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 222/15526 [04:09<4:47:00,  1.13s/it, v_num=73vx, train/loss=5.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 223/15526 [04:10<4:46:27,  1.12s/it, v_num=73vx, train/loss=5.0\r",
-      "Epoch 0:   1%| | 223/15526 [04:10<4:46:27,  1.12s/it, v_num=73vx, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 224/15526 [04:17<4:53:03,  1.15s/it, v_num=73vx, train/loss=0.6\r",
-      "Epoch 0:   1%| | 224/15526 [04:17<4:53:03,  1.15s/it, v_num=73vx, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 225/15526 [04:18<4:52:29,  1.15s/it, v_num=73vx, train/loss=1.6\r",
-      "Epoch 0:   1%| | 225/15526 [04:18<4:52:29,  1.15s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 226/15526 [04:18<4:51:56,  1.14s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 226/15526 [04:18<4:51:56,  1.14s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 227/15526 [04:19<4:51:23,  1.14s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 227/15526 [04:19<4:51:23,  1.14s/it, v_num=73vx, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 228/15526 [04:20<4:50:50,  1.14s/it, v_num=73vx, train/loss=2.0\r",
-      "Epoch 0:   1%| | 228/15526 [04:20<4:50:50,  1.14s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 229/15526 [04:20<4:50:18,  1.14s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   1%| | 229/15526 [04:20<4:50:18,  1.14s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 230/15526 [04:21<4:49:46,  1.14s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   1%| | 230/15526 [04:21<4:49:46,  1.14s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 231/15526 [04:22<4:49:15,  1.13s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 231/15526 [04:22<4:49:15,  1.13s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 232/15526 [04:22<4:48:43,  1.13s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   1%| | 232/15526 [04:22<4:48:43,  1.13s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 233/15526 [04:23<4:48:12,  1.13s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 233/15526 [04:23<4:48:12,  1.13s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 234/15526 [04:24<4:47:42,  1.13s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   2%| | 234/15526 [04:24<4:47:42,  1.13s/it, v_num=73vx, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 235/15526 [04:24<4:47:15,  1.13s/it, v_num=73vx, train/loss=1.4\r",
-      "Epoch 0:   2%| | 235/15526 [04:24<4:47:15,  1.13s/it, v_num=73vx, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 236/15526 [04:25<4:46:45,  1.13s/it, v_num=73vx, train/loss=1.6\r",
-      "Epoch 0:   2%| | 236/15526 [04:25<4:46:45,  1.13s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 237/15526 [04:26<4:46:14,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 237/15526 [04:26<4:46:14,  1.12s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 238/15526 [04:26<4:45:44,  1.12s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   2%| | 238/15526 [04:26<4:45:44,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 239/15526 [04:27<4:45:15,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 239/15526 [04:27<4:45:15,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 240/15526 [04:28<4:44:47,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 240/15526 [04:28<4:44:47,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 241/15526 [04:28<4:44:18,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 241/15526 [04:28<4:44:18,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 242/15526 [04:29<4:43:50,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 242/15526 [04:29<4:43:50,  1.11s/it, v_num=73vx, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 243/15526 [04:30<4:43:54,  1.11s/it, v_num=73vx, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 243/15526 [04:30<4:43:54,  1.11s/it, v_num=73vx, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 244/15526 [04:31<4:43:26,  1.11s/it, v_num=73vx, train/loss=3.2\r",
-      "Epoch 0:   2%| | 244/15526 [04:31<4:43:26,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 245/15526 [04:32<4:43:30,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 245/15526 [04:32<4:43:30,  1.11s/it, v_num=73vx, train/loss=5.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 246/15526 [04:33<4:43:02,  1.11s/it, v_num=73vx, train/loss=5.2\r",
-      "Epoch 0:   2%| | 246/15526 [04:33<4:43:02,  1.11s/it, v_num=73vx, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 247/15526 [04:34<4:43:22,  1.11s/it, v_num=73vx, train/loss=1.9\r",
-      "Epoch 0:   2%| | 247/15526 [04:34<4:43:22,  1.11s/it, v_num=73vx, train/loss=2.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 248/15526 [04:35<4:42:54,  1.11s/it, v_num=73vx, train/loss=2.3\r",
-      "Epoch 0:   2%| | 248/15526 [04:35<4:42:54,  1.11s/it, v_num=73vx, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 249/15526 [04:36<4:42:26,  1.11s/it, v_num=73vx, train/loss=0.9\r",
-      "Epoch 0:   2%| | 249/15526 [04:36<4:42:26,  1.11s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 250/15526 [04:37<4:42:32,  1.11s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   2%| | 250/15526 [04:37<4:42:32,  1.11s/it, v_num=73vx, train/loss=3.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 251/15526 [04:38<4:42:05,  1.11s/it, v_num=73vx, train/loss=3.8\r",
-      "Epoch 0:   2%| | 251/15526 [04:38<4:42:05,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 252/15526 [04:38<4:41:38,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   2%| | 252/15526 [04:38<4:41:38,  1.11s/it, v_num=73vx, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 253/15526 [04:39<4:41:11,  1.10s/it, v_num=73vx, train/loss=1.2\r",
-      "Epoch 0:   2%| | 253/15526 [04:39<4:41:11,  1.10s/it, v_num=73vx, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 254/15526 [04:40<4:40:44,  1.10s/it, v_num=73vx, train/loss=2.0\r",
-      "Epoch 0:   2%| | 254/15526 [04:40<4:40:44,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 255/15526 [04:40<4:40:17,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 255/15526 [04:40<4:40:17,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 256/15526 [04:53<4:51:22,  1.14s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 256/15526 [04:53<4:51:22,  1.14s/it, v_num=73vx, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 257/15526 [04:54<4:51:27,  1.15s/it, v_num=73vx, train/loss=2.1\r",
-      "Epoch 0:   2%| | 257/15526 [04:54<4:51:27,  1.15s/it, v_num=73vx, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 258/15526 [04:55<4:50:58,  1.14s/it, v_num=73vx, train/loss=1.7\r",
-      "Epoch 0:   2%| | 258/15526 [04:55<4:50:58,  1.14s/it, v_num=73vx, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 259/15526 [04:56<4:51:02,  1.14s/it, v_num=73vx, train/loss=1.7\r",
-      "Epoch 0:   2%| | 259/15526 [04:56<4:51:02,  1.14s/it, v_num=73vx, train/loss=2.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 260/15526 [04:56<4:50:33,  1.14s/it, v_num=73vx, train/loss=2.7\r",
-      "Epoch 0:   2%| | 260/15526 [04:56<4:50:33,  1.14s/it, v_num=73vx, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 261/15526 [04:57<4:50:06,  1.14s/it, v_num=73vx, train/loss=1.3\r",
-      "Epoch 0:   2%| | 261/15526 [04:57<4:50:06,  1.14s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 262/15526 [04:58<4:50:08,  1.14s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 262/15526 [04:58<4:50:08,  1.14s/it, v_num=73vx, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 263/15526 [05:00<4:50:10,  1.14s/it, v_num=73vx, train/loss=3.5\r",
-      "Epoch 0:   2%| | 263/15526 [05:00<4:50:10,  1.14s/it, v_num=73vx, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 264/15526 [05:01<4:50:11,  1.14s/it, v_num=73vx, train/loss=3.5\r",
-      "Epoch 0:   2%| | 264/15526 [05:01<4:50:11,  1.14s/it, v_num=73vx, train/loss=3.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 265/15526 [05:01<4:49:43,  1.14s/it, v_num=73vx, train/loss=3.4\r",
-      "Epoch 0:   2%| | 265/15526 [05:01<4:49:43,  1.14s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 266/15526 [05:02<4:49:15,  1.14s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 266/15526 [05:02<4:49:15,  1.14s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 267/15526 [05:03<4:48:47,  1.14s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 267/15526 [05:03<4:48:48,  1.14s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 268/15526 [05:03<4:48:20,  1.13s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   2%| | 268/15526 [05:03<4:48:20,  1.13s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 269/15526 [05:04<4:47:53,  1.13s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 269/15526 [05:04<4:47:53,  1.13s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 270/15526 [05:05<4:47:26,  1.13s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   2%| | 270/15526 [05:05<4:47:26,  1.13s/it, v_num=73vx, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 271/15526 [05:05<4:46:59,  1.13s/it, v_num=73vx, train/loss=1.4\r",
-      "Epoch 0:   2%| | 271/15526 [05:05<4:46:59,  1.13s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 272/15526 [05:07<4:47:01,  1.13s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 272/15526 [05:07<4:47:01,  1.13s/it, v_num=73vx, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 273/15526 [05:08<4:47:04,  1.13s/it, v_num=73vx, train/loss=2.2\r",
-      "Epoch 0:   2%| | 273/15526 [05:08<4:47:04,  1.13s/it, v_num=73vx, train/loss=3.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 274/15526 [05:08<4:46:37,  1.13s/it, v_num=73vx, train/loss=3.0\r",
-      "Epoch 0:   2%| | 274/15526 [05:08<4:46:37,  1.13s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 275/15526 [05:10<4:46:40,  1.13s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   2%| | 275/15526 [05:10<4:46:40,  1.13s/it, v_num=73vx, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 276/15526 [05:11<4:46:42,  1.13s/it, v_num=73vx, train/loss=1.9\r",
-      "Epoch 0:   2%| | 276/15526 [05:11<4:46:42,  1.13s/it, v_num=73vx, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 277/15526 [05:12<4:46:16,  1.13s/it, v_num=73vx, train/loss=2.1\r",
-      "Epoch 0:   2%| | 277/15526 [05:12<4:46:16,  1.13s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 278/15526 [05:12<4:45:51,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 278/15526 [05:12<4:45:51,  1.12s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 279/15526 [05:13<4:45:25,  1.12s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   2%| | 279/15526 [05:13<4:45:25,  1.12s/it, v_num=73vx, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 280/15526 [05:14<4:44:59,  1.12s/it, v_num=73vx, train/loss=1.2\r",
-      "Epoch 0:   2%| | 280/15526 [05:14<4:44:59,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 281/15526 [05:16<4:45:45,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 281/15526 [05:16<4:45:45,  1.12s/it, v_num=73vx, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 282/15526 [05:16<4:45:19,  1.12s/it, v_num=73vx, train/loss=2.0\r",
-      "Epoch 0:   2%| | 282/15526 [05:16<4:45:19,  1.12s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 283/15526 [05:17<4:45:21,  1.12s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   2%| | 283/15526 [05:17<4:45:21,  1.12s/it, v_num=73vx, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 284/15526 [05:18<4:44:56,  1.12s/it, v_num=73vx, train/loss=3.5\r",
-      "Epoch 0:   2%| | 284/15526 [05:18<4:44:56,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 285/15526 [05:19<4:44:31,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 285/15526 [05:19<4:44:31,  1.12s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 286/15526 [05:19<4:44:05,  1.12s/it, v_num=73vx, train/loss=0.7\r",
-      "Epoch 0:   2%| | 286/15526 [05:19<4:44:05,  1.12s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 287/15526 [05:21<4:44:07,  1.12s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   2%| | 287/15526 [05:21<4:44:07,  1.12s/it, v_num=73vx, train/loss=4.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 288/15526 [05:26<4:48:19,  1.14s/it, v_num=73vx, train/loss=4.0\r",
-      "Epoch 0:   2%| | 288/15526 [05:26<4:48:19,  1.14s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 289/15526 [05:28<4:48:20,  1.14s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 289/15526 [05:28<4:48:20,  1.14s/it, v_num=73vx, train/loss=4.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 290/15526 [05:28<4:47:54,  1.13s/it, v_num=73vx, train/loss=4.0\r",
-      "Epoch 0:   2%| | 290/15526 [05:28<4:47:54,  1.13s/it, v_num=73vx, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 291/15526 [05:29<4:47:28,  1.13s/it, v_num=73vx, train/loss=0.9\r",
-      "Epoch 0:   2%| | 291/15526 [05:29<4:47:28,  1.13s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 292/15526 [05:30<4:47:02,  1.13s/it, v_num=73vx, train/loss=0.7\r",
-      "Epoch 0:   2%| | 292/15526 [05:30<4:47:03,  1.13s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 293/15526 [05:31<4:47:03,  1.13s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 293/15526 [05:31<4:47:03,  1.13s/it, v_num=73vx, train/loss=2.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 294/15526 [05:31<4:46:37,  1.13s/it, v_num=73vx, train/loss=2.9\r",
-      "Epoch 0:   2%| | 294/15526 [05:31<4:46:37,  1.13s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 295/15526 [05:32<4:46:13,  1.13s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 295/15526 [05:32<4:46:13,  1.13s/it, v_num=73vx, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 296/15526 [05:33<4:46:14,  1.13s/it, v_num=73vx, train/loss=0.8\r",
-      "Epoch 0:   2%| | 296/15526 [05:33<4:46:14,  1.13s/it, v_num=73vx, train/loss=3.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 297/15526 [05:34<4:46:15,  1.13s/it, v_num=73vx, train/loss=3.4\r",
-      "Epoch 0:   2%| | 297/15526 [05:34<4:46:15,  1.13s/it, v_num=73vx, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 298/15526 [05:35<4:45:50,  1.13s/it, v_num=73vx, train/loss=1.9\r",
-      "Epoch 0:   2%| | 298/15526 [05:35<4:45:50,  1.13s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 299/15526 [05:36<4:45:25,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 299/15526 [05:36<4:45:25,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 300/15526 [05:36<4:45:00,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 300/15526 [05:36<4:45:00,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 301/15526 [05:37<4:44:36,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 301/15526 [05:37<4:44:36,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 302/15526 [05:38<4:44:38,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 302/15526 [05:38<4:44:38,  1.12s/it, v_num=73vx, train/loss=2.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 303/15526 [05:39<4:44:14,  1.12s/it, v_num=73vx, train/loss=2.8\r",
-      "Epoch 0:   2%| | 303/15526 [05:39<4:44:14,  1.12s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 304/15526 [05:40<4:44:17,  1.12s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   2%| | 304/15526 [05:40<4:44:17,  1.12s/it, v_num=73vx, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 305/15526 [05:41<4:43:54,  1.12s/it, v_num=73vx, train/loss=1.6\r",
-      "Epoch 0:   2%| | 305/15526 [05:41<4:43:54,  1.12s/it, v_num=73vx, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 306/15526 [05:41<4:43:30,  1.12s/it, v_num=73vx, train/loss=1.0\r",
-      "Epoch 0:   2%| | 306/15526 [05:41<4:43:30,  1.12s/it, v_num=73vx, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 307/15526 [05:42<4:43:07,  1.12s/it, v_num=73vx, train/loss=1.3\r",
-      "Epoch 0:   2%| | 307/15526 [05:42<4:43:07,  1.12s/it, v_num=73vx, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 308/15526 [05:43<4:42:43,  1.11s/it, v_num=73vx, train/loss=1.4\r",
-      "Epoch 0:   2%| | 308/15526 [05:43<4:42:43,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 309/15526 [05:44<4:42:44,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 309/15526 [05:44<4:42:44,  1.11s/it, v_num=73vx, train/loss=2.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 310/15526 [05:45<4:42:21,  1.11s/it, v_num=73vx, train/loss=2.3\r",
-      "Epoch 0:   2%| | 310/15526 [05:45<4:42:21,  1.11s/it, v_num=73vx, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 311/15526 [05:46<4:42:22,  1.11s/it, v_num=73vx, train/loss=0.6\r",
-      "Epoch 0:   2%| | 311/15526 [05:46<4:42:22,  1.11s/it, v_num=73vx, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 312/15526 [05:46<4:41:59,  1.11s/it, v_num=73vx, train/loss=3.2\r",
-      "Epoch 0:   2%| | 312/15526 [05:46<4:41:59,  1.11s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 313/15526 [05:47<4:41:36,  1.11s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   2%| | 313/15526 [05:47<4:41:36,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 314/15526 [05:48<4:41:38,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 314/15526 [05:48<4:41:38,  1.11s/it, v_num=73vx, train/loss=4.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 315/15526 [05:49<4:41:16,  1.11s/it, v_num=73vx, train/loss=4.3\r",
-      "Epoch 0:   2%| | 315/15526 [05:49<4:41:16,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 316/15526 [05:50<4:40:53,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 316/15526 [05:50<4:40:53,  1.11s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 317/15526 [05:51<4:40:54,  1.11s/it, v_num=73vx, train/loss=0.7\r",
-      "Epoch 0:   2%| | 317/15526 [05:51<4:40:54,  1.11s/it, v_num=73vx, train/loss=3.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 318/15526 [05:52<4:40:56,  1.11s/it, v_num=73vx, train/loss=3.7\r",
-      "Epoch 0:   2%| | 318/15526 [05:52<4:40:56,  1.11s/it, v_num=73vx, train/loss=3.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 319/15526 [05:53<4:40:34,  1.11s/it, v_num=73vx, train/loss=3.8\r",
-      "Epoch 0:   2%| | 319/15526 [05:53<4:40:34,  1.11s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 320/15526 [06:02<4:46:50,  1.13s/it, v_num=73vx, train/loss=0.7\r",
-      "Epoch 0:   2%| | 320/15526 [06:02<4:46:50,  1.13s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 321/15526 [06:02<4:46:26,  1.13s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 321/15526 [06:02<4:46:26,  1.13s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 322/15526 [06:04<4:46:27,  1.13s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   2%| | 322/15526 [06:04<4:46:27,  1.13s/it, v_num=73vx, train/loss=4.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 323/15526 [06:04<4:46:04,  1.13s/it, v_num=73vx, train/loss=4.0\r",
-      "Epoch 0:   2%| | 323/15526 [06:04<4:46:04,  1.13s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 324/15526 [06:05<4:46:04,  1.13s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   2%| | 324/15526 [06:05<4:46:04,  1.13s/it, v_num=73vx, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 325/15526 [06:06<4:45:41,  1.13s/it, v_num=73vx, train/loss=2.5\r",
-      "Epoch 0:   2%| | 325/15526 [06:06<4:45:41,  1.13s/it, v_num=73vx, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 326/15526 [06:07<4:45:18,  1.13s/it, v_num=73vx, train/loss=1.3\r",
-      "Epoch 0:   2%| | 326/15526 [06:07<4:45:18,  1.13s/it, v_num=73vx, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 327/15526 [06:08<4:45:19,  1.13s/it, v_num=73vx, train/loss=1.2\r",
-      "Epoch 0:   2%| | 327/15526 [06:08<4:45:19,  1.13s/it, v_num=73vx, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 328/15526 [06:09<4:45:19,  1.13s/it, v_num=73vx, train/loss=2.0\r",
-      "Epoch 0:   2%| | 328/15526 [06:09<4:45:19,  1.13s/it, v_num=73vx, train/loss=3.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 329/15526 [06:10<4:44:57,  1.13s/it, v_num=73vx, train/loss=3.0\r",
-      "Epoch 0:   2%| | 329/15526 [06:10<4:44:57,  1.13s/it, v_num=73vx, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 330/15526 [06:11<4:44:57,  1.13s/it, v_num=73vx, train/loss=1.2\r",
-      "Epoch 0:   2%| | 330/15526 [06:11<4:44:57,  1.13s/it, v_num=73vx, train/loss=2.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 331/15526 [06:11<4:44:34,  1.12s/it, v_num=73vx, train/loss=2.8\r",
-      "Epoch 0:   2%| | 331/15526 [06:11<4:44:34,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 332/15526 [06:12<4:44:12,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 332/15526 [06:12<4:44:12,  1.12s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 333/15526 [06:13<4:44:14,  1.12s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   2%| | 333/15526 [06:13<4:44:14,  1.12s/it, v_num=73vx, train/loss=2.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 334/15526 [06:14<4:43:52,  1.12s/it, v_num=73vx, train/loss=2.6\r",
-      "Epoch 0:   2%| | 334/15526 [06:14<4:43:52,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 335/15526 [06:15<4:43:53,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 335/15526 [06:15<4:43:53,  1.12s/it, v_num=73vx, train/loss=2.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 336/15526 [06:16<4:43:53,  1.12s/it, v_num=73vx, train/loss=2.4\r",
-      "Epoch 0:   2%| | 336/15526 [06:16<4:43:53,  1.12s/it, v_num=73vx, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 337/15526 [06:17<4:43:31,  1.12s/it, v_num=73vx, train/loss=2.2\r",
-      "Epoch 0:   2%| | 337/15526 [06:17<4:43:31,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 338/15526 [06:18<4:43:10,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 338/15526 [06:18<4:43:10,  1.12s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 339/15526 [06:18<4:42:48,  1.12s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   2%| | 339/15526 [06:18<4:42:48,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 340/15526 [06:19<4:42:27,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 340/15526 [06:19<4:42:27,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 341/15526 [06:20<4:42:05,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 341/15526 [06:20<4:42:05,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 342/15526 [06:20<4:41:43,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 342/15526 [06:20<4:41:43,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 343/15526 [06:21<4:41:22,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 343/15526 [06:21<4:41:22,  1.11s/it, v_num=73vx, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 344/15526 [06:23<4:42:21,  1.12s/it, v_num=73vx, train/loss=1.4\r",
-      "Epoch 0:   2%| | 344/15526 [06:23<4:42:21,  1.12s/it, v_num=73vx, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 345/15526 [06:25<4:42:22,  1.12s/it, v_num=73vx, train/loss=1.4\r",
-      "Epoch 0:   2%| | 345/15526 [06:25<4:42:22,  1.12s/it, v_num=73vx, train/loss=3.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 346/15526 [06:25<4:42:01,  1.11s/it, v_num=73vx, train/loss=3.0\r",
-      "Epoch 0:   2%| | 346/15526 [06:25<4:42:01,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 347/15526 [06:26<4:42:02,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 347/15526 [06:26<4:42:02,  1.11s/it, v_num=73vx, train/loss=3.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 348/15526 [06:27<4:41:40,  1.11s/it, v_num=73vx, train/loss=3.4\r",
-      "Epoch 0:   2%| | 348/15526 [06:27<4:41:40,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 349/15526 [06:28<4:41:42,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 349/15526 [06:28<4:41:42,  1.11s/it, v_num=73vx, train/loss=3.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 350/15526 [06:29<4:41:21,  1.11s/it, v_num=73vx, train/loss=3.8\r",
-      "Epoch 0:   2%| | 350/15526 [06:29<4:41:21,  1.11s/it, v_num=73vx, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 351/15526 [06:29<4:41:00,  1.11s/it, v_num=73vx, train/loss=1.0\r",
-      "Epoch 0:   2%| | 351/15526 [06:29<4:41:00,  1.11s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 352/15526 [06:35<4:44:24,  1.12s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   2%| | 352/15526 [06:35<4:44:24,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 353/15526 [06:37<4:44:25,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 353/15526 [06:37<4:44:25,  1.12s/it, v_num=73vx, train/loss=3.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 354/15526 [06:38<4:44:26,  1.12s/it, v_num=73vx, train/loss=3.8\r",
-      "Epoch 0:   2%| | 354/15526 [06:38<4:44:26,  1.12s/it, v_num=73vx, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 355/15526 [06:39<4:44:28,  1.13s/it, v_num=73vx, train/loss=1.5\r",
-      "Epoch 0:   2%| | 355/15526 [06:39<4:44:28,  1.13s/it, v_num=73vx, train/loss=2.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 356/15526 [06:40<4:44:07,  1.12s/it, v_num=73vx, train/loss=2.6\r",
-      "Epoch 0:   2%| | 356/15526 [06:40<4:44:07,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 357/15526 [06:40<4:43:47,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 357/15526 [06:40<4:43:47,  1.12s/it, v_num=73vx, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 358/15526 [06:41<4:43:50,  1.12s/it, v_num=73vx, train/loss=0.8\r",
-      "Epoch 0:   2%| | 358/15526 [06:41<4:43:50,  1.12s/it, v_num=73vx, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 359/15526 [06:42<4:43:31,  1.12s/it, v_num=73vx, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 359/15526 [06:42<4:43:31,  1.12s/it, v_num=73vx, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 360/15526 [06:43<4:43:12,  1.12s/it, v_num=73vx, train/loss=0.9\r",
-      "Epoch 0:   2%| | 360/15526 [06:43<4:43:12,  1.12s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 361/15526 [06:44<4:42:52,  1.12s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   2%| | 361/15526 [06:44<4:42:52,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 362/15526 [06:44<4:42:34,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 362/15526 [06:44<4:42:34,  1.12s/it, v_num=73vx, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 363/15526 [06:45<4:42:14,  1.12s/it, v_num=73vx, train/loss=1.0\r",
-      "Epoch 0:   2%| | 363/15526 [06:45<4:42:14,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 364/15526 [06:46<4:41:55,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 364/15526 [06:46<4:41:55,  1.12s/it, v_num=73vx, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 365/15526 [06:46<4:41:37,  1.11s/it, v_num=73vx, train/loss=0.8\r",
-      "Epoch 0:   2%| | 365/15526 [06:46<4:41:37,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 366/15526 [06:48<4:41:40,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   2%| | 366/15526 [06:48<4:41:40,  1.11s/it, v_num=73vx, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 367/15526 [06:48<4:41:21,  1.11s/it, v_num=73vx, train/loss=1.9\r",
-      "Epoch 0:   2%| | 367/15526 [06:48<4:41:21,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 368/15526 [06:49<4:41:02,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 368/15526 [06:49<4:41:02,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 369/15526 [06:50<4:40:43,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 369/15526 [06:50<4:40:43,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 370/15526 [06:50<4:40:24,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 370/15526 [06:50<4:40:24,  1.11s/it, v_num=73vx, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 371/15526 [06:51<4:40:27,  1.11s/it, v_num=73vx, train/loss=1.3\r",
-      "Epoch 0:   2%| | 371/15526 [06:51<4:40:28,  1.11s/it, v_num=73vx, train/loss=3.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 372/15526 [06:52<4:40:09,  1.11s/it, v_num=73vx, train/loss=3.9\r",
-      "Epoch 0:   2%| | 372/15526 [06:52<4:40:09,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 373/15526 [06:53<4:40:12,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 373/15526 [06:53<4:40:12,  1.11s/it, v_num=73vx, train/loss=3.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 374/15526 [06:54<4:39:55,  1.11s/it, v_num=73vx, train/loss=3.4\r",
-      "Epoch 0:   2%| | 374/15526 [06:54<4:39:55,  1.11s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 375/15526 [06:55<4:39:37,  1.11s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   2%| | 375/15526 [06:55<4:39:37,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 376/15526 [06:55<4:39:19,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 376/15526 [06:55<4:39:19,  1.11s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 377/15526 [06:56<4:39:00,  1.11s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   2%| | 377/15526 [06:56<4:39:00,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 378/15526 [06:57<4:39:03,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   2%| | 378/15526 [06:57<4:39:03,  1.11s/it, v_num=73vx, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 379/15526 [06:58<4:38:45,  1.10s/it, v_num=73vx, train/loss=3.5\r",
-      "Epoch 0:   2%| | 379/15526 [06:58<4:38:45,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 380/15526 [06:59<4:38:27,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 380/15526 [06:59<4:38:27,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 381/15526 [06:59<4:38:10,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 381/15526 [06:59<4:38:10,  1.10s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 382/15526 [07:00<4:37:52,  1.10s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   2%| | 382/15526 [07:00<4:37:52,  1.10s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 383/15526 [07:01<4:37:34,  1.10s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   2%| | 383/15526 [07:01<4:37:34,  1.10s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 384/15526 [07:11<4:43:28,  1.12s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   2%| | 384/15526 [07:11<4:43:28,  1.12s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 385/15526 [07:12<4:43:09,  1.12s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 385/15526 [07:12<4:43:09,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 386/15526 [07:12<4:42:51,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 386/15526 [07:12<4:42:51,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 387/15526 [07:13<4:42:53,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   2%| | 387/15526 [07:13<4:42:53,  1.12s/it, v_num=73vx, train/loss=2.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 388/15526 [07:14<4:42:35,  1.12s/it, v_num=73vx, train/loss=2.8\r",
-      "Epoch 0:   2%| | 388/15526 [07:14<4:42:35,  1.12s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 389/15526 [07:15<4:42:16,  1.12s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   3%| | 389/15526 [07:15<4:42:16,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 390/15526 [07:15<4:41:58,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 390/15526 [07:15<4:41:58,  1.12s/it, v_num=73vx, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 391/15526 [07:17<4:42:00,  1.12s/it, v_num=73vx, train/loss=0.9\r",
-      "Epoch 0:   3%| | 391/15526 [07:17<4:42:00,  1.12s/it, v_num=73vx, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 392/15526 [07:17<4:41:43,  1.12s/it, v_num=73vx, train/loss=1.9\r",
-      "Epoch 0:   3%| | 392/15526 [07:17<4:41:43,  1.12s/it, v_num=73vx, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 393/15526 [07:19<4:41:45,  1.12s/it, v_num=73vx, train/loss=1.0\r",
-      "Epoch 0:   3%| | 393/15526 [07:19<4:41:45,  1.12s/it, v_num=73vx, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 394/15526 [07:20<4:41:48,  1.12s/it, v_num=73vx, train/loss=3.5\r",
-      "Epoch 0:   3%| | 394/15526 [07:20<4:41:48,  1.12s/it, v_num=73vx, train/loss=2.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 395/15526 [07:21<4:41:50,  1.12s/it, v_num=73vx, train/loss=2.9\r",
-      "Epoch 0:   3%| | 395/15526 [07:21<4:41:50,  1.12s/it, v_num=73vx, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 396/15526 [07:22<4:41:32,  1.12s/it, v_num=73vx, train/loss=1.8\r",
-      "Epoch 0:   3%| | 396/15526 [07:22<4:41:32,  1.12s/it, v_num=73vx, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 397/15526 [07:22<4:41:14,  1.12s/it, v_num=73vx, train/loss=1.1\r",
-      "Epoch 0:   3%| | 397/15526 [07:22<4:41:14,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 398/15526 [07:23<4:40:56,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 398/15526 [07:23<4:40:56,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 399/15526 [07:24<4:40:38,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 399/15526 [07:24<4:40:38,  1.11s/it, v_num=73vx, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 400/15526 [07:24<4:40:21,  1.11s/it, v_num=73vx, train/loss=0.6\r",
-      "Epoch 0:   3%| | 400/15526 [07:24<4:40:21,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 401/15526 [07:26<4:40:24,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 401/15526 [07:26<4:40:24,  1.11s/it, v_num=73vx, train/loss=2.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 402/15526 [07:26<4:40:06,  1.11s/it, v_num=73vx, train/loss=2.6\r",
-      "Epoch 0:   3%| | 402/15526 [07:26<4:40:06,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 403/15526 [07:27<4:40:11,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   3%| | 403/15526 [07:27<4:40:11,  1.11s/it, v_num=73vx, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 404/15526 [07:28<4:39:54,  1.11s/it, v_num=73vx, train/loss=1.3\r",
-      "Epoch 0:   3%| | 404/15526 [07:28<4:39:54,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 405/15526 [07:29<4:39:57,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 405/15526 [07:29<4:39:57,  1.11s/it, v_num=73vx, train/loss=2.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 406/15526 [07:30<4:39:40,  1.11s/it, v_num=73vx, train/loss=2.3\r",
-      "Epoch 0:   3%| | 406/15526 [07:30<4:39:40,  1.11s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 407/15526 [07:31<4:39:23,  1.11s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   3%| | 407/15526 [07:31<4:39:23,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 408/15526 [07:32<4:39:29,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   3%| | 408/15526 [07:32<4:39:29,  1.11s/it, v_num=73vx, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 409/15526 [07:33<4:39:33,  1.11s/it, v_num=73vx, train/loss=1.1\r",
-      "Epoch 0:   3%| | 409/15526 [07:33<4:39:33,  1.11s/it, v_num=73vx, train/loss=2.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 410/15526 [07:34<4:39:16,  1.11s/it, v_num=73vx, train/loss=2.9\r",
-      "Epoch 0:   3%| | 410/15526 [07:34<4:39:16,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 411/15526 [07:35<4:38:59,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 411/15526 [07:35<4:38:59,  1.11s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 412/15526 [07:35<4:38:43,  1.11s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   3%| | 412/15526 [07:35<4:38:43,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 413/15526 [07:37<4:38:45,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 413/15526 [07:37<4:38:45,  1.11s/it, v_num=73vx, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 414/15526 [07:37<4:38:29,  1.11s/it, v_num=73vx, train/loss=1.9\r",
-      "Epoch 0:   3%| | 414/15526 [07:37<4:38:29,  1.11s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 415/15526 [07:38<4:38:31,  1.11s/it, v_num=73vx, train/loss=0.7\r",
-      "Epoch 0:   3%| | 415/15526 [07:38<4:38:31,  1.11s/it, v_num=73vx, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 416/15526 [07:46<4:42:22,  1.12s/it, v_num=73vx, train/loss=1.3\r",
-      "Epoch 0:   3%| | 416/15526 [07:46<4:42:22,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 417/15526 [07:47<4:42:04,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 417/15526 [07:47<4:42:04,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 418/15526 [07:47<4:41:47,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 418/15526 [07:47<4:41:47,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 419/15526 [07:48<4:41:30,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 419/15526 [07:48<4:41:30,  1.12s/it, v_num=73vx, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 420/15526 [07:49<4:41:32,  1.12s/it, v_num=73vx, train/loss=0.8\r",
-      "Epoch 0:   3%| | 420/15526 [07:49<4:41:32,  1.12s/it, v_num=73vx, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 421/15526 [07:50<4:41:35,  1.12s/it, v_num=73vx, train/loss=3.2\r",
-      "Epoch 0:   3%| | 421/15526 [07:50<4:41:35,  1.12s/it, v_num=73vx, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 422/15526 [07:51<4:41:18,  1.12s/it, v_num=73vx, train/loss=2.0\r",
-      "Epoch 0:   3%| | 422/15526 [07:51<4:41:18,  1.12s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 423/15526 [07:52<4:41:21,  1.12s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   3%| | 423/15526 [07:52<4:41:21,  1.12s/it, v_num=73vx, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 424/15526 [07:53<4:41:05,  1.12s/it, v_num=73vx, train/loss=3.3\r",
-      "Epoch 0:   3%| | 424/15526 [07:53<4:41:05,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 425/15526 [07:54<4:41:07,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 425/15526 [07:54<4:41:07,  1.12s/it, v_num=73vx, train/loss=2.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 426/15526 [07:55<4:40:51,  1.12s/it, v_num=73vx, train/loss=2.6\r",
-      "Epoch 0:   3%| | 426/15526 [07:55<4:40:51,  1.12s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 427/15526 [07:56<4:40:53,  1.12s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   3%| | 427/15526 [07:56<4:40:53,  1.12s/it, v_num=73vx, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 428/15526 [07:57<4:40:36,  1.12s/it, v_num=73vx, train/loss=3.1\r",
-      "Epoch 0:   3%| | 428/15526 [07:57<4:40:37,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 429/15526 [07:58<4:40:38,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 429/15526 [07:58<4:40:39,  1.12s/it, v_num=73vx, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 430/15526 [07:59<4:40:41,  1.12s/it, v_num=73vx, train/loss=1.1\r",
-      "Epoch 0:   3%| | 430/15526 [07:59<4:40:41,  1.12s/it, v_num=73vx, train/loss=2.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 431/15526 [08:00<4:40:24,  1.11s/it, v_num=73vx, train/loss=2.9\r",
-      "Epoch 0:   3%| | 431/15526 [08:00<4:40:24,  1.11s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 432/15526 [08:01<4:40:08,  1.11s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   3%| | 432/15526 [08:01<4:40:08,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 433/15526 [08:02<4:40:09,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 433/15526 [08:02<4:40:09,  1.11s/it, v_num=73vx, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 434/15526 [08:02<4:39:53,  1.11s/it, v_num=73vx, train/loss=3.1\r",
-      "Epoch 0:   3%| | 434/15526 [08:02<4:39:53,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 435/15526 [08:04<4:39:55,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 435/15526 [08:04<4:39:55,  1.11s/it, v_num=73vx, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 436/15526 [08:05<4:39:58,  1.11s/it, v_num=73vx, train/loss=2.5\r",
-      "Epoch 0:   3%| | 436/15526 [08:05<4:39:58,  1.11s/it, v_num=73vx, train/loss=2.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 437/15526 [08:06<4:39:41,  1.11s/it, v_num=73vx, train/loss=2.6\r",
-      "Epoch 0:   3%| | 437/15526 [08:06<4:39:41,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 438/15526 [08:06<4:39:25,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 438/15526 [08:06<4:39:25,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 439/15526 [08:07<4:39:28,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 439/15526 [08:07<4:39:28,  1.11s/it, v_num=73vx, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 440/15526 [08:09<4:39:30,  1.11s/it, v_num=73vx, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 440/15526 [08:09<4:39:30,  1.11s/it, v_num=73vx, train/loss=2.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 441/15526 [08:09<4:39:15,  1.11s/it, v_num=73vx, train/loss=2.3\r",
-      "Epoch 0:   3%| | 441/15526 [08:09<4:39:15,  1.11s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 442/15526 [08:10<4:38:59,  1.11s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   3%| | 442/15526 [08:10<4:38:59,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 443/15526 [08:11<4:39:01,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 443/15526 [08:11<4:39:01,  1.11s/it, v_num=73vx, train/loss=2.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 444/15526 [08:12<4:38:45,  1.11s/it, v_num=73vx, train/loss=2.8\r",
-      "Epoch 0:   3%| | 444/15526 [08:12<4:38:45,  1.11s/it, v_num=73vx, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 445/15526 [08:13<4:38:47,  1.11s/it, v_num=73vx, train/loss=0.8\r",
-      "Epoch 0:   3%| | 445/15526 [08:13<4:38:47,  1.11s/it, v_num=73vx, train/loss=2.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 446/15526 [08:14<4:38:31,  1.11s/it, v_num=73vx, train/loss=2.8\r",
-      "Epoch 0:   3%| | 446/15526 [08:14<4:38:31,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 447/15526 [08:14<4:38:16,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 447/15526 [08:14<4:38:16,  1.11s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 448/15526 [08:21<4:41:34,  1.12s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   3%| | 448/15526 [08:21<4:41:34,  1.12s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 449/15526 [08:22<4:41:19,  1.12s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   3%| | 449/15526 [08:22<4:41:19,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 450/15526 [08:23<4:41:04,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 450/15526 [08:23<4:41:04,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 451/15526 [08:24<4:40:48,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 451/15526 [08:24<4:40:48,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 452/15526 [08:24<4:40:33,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 452/15526 [08:24<4:40:33,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 453/15526 [08:25<4:40:35,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 453/15526 [08:25<4:40:35,  1.12s/it, v_num=73vx, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 454/15526 [08:27<4:40:38,  1.12s/it, v_num=73vx, train/loss=2.0\r",
-      "Epoch 0:   3%| | 454/15526 [08:27<4:40:38,  1.12s/it, v_num=73vx, train/loss=2.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 455/15526 [08:27<4:40:23,  1.12s/it, v_num=73vx, train/loss=2.9\r",
-      "Epoch 0:   3%| | 455/15526 [08:27<4:40:23,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 456/15526 [08:28<4:40:08,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 456/15526 [08:28<4:40:08,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 457/15526 [08:29<4:39:53,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 457/15526 [08:29<4:39:53,  1.11s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 458/15526 [08:29<4:39:38,  1.11s/it, v_num=73vx, train/loss=0.7\r",
-      "Epoch 0:   3%| | 458/15526 [08:29<4:39:38,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 459/15526 [08:31<4:39:41,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 459/15526 [08:31<4:39:41,  1.11s/it, v_num=73vx, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 460/15526 [08:31<4:39:26,  1.11s/it, v_num=73vx, train/loss=2.2\r",
-      "Epoch 0:   3%| | 460/15526 [08:31<4:39:26,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 461/15526 [08:32<4:39:11,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 461/15526 [08:32<4:39:11,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 462/15526 [08:33<4:38:56,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 462/15526 [08:33<4:38:56,  1.11s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 463/15526 [08:33<4:38:41,  1.11s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 463/15526 [08:33<4:38:41,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 464/15526 [08:35<4:38:43,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 464/15526 [08:35<4:38:43,  1.11s/it, v_num=73vx, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 465/15526 [08:36<4:38:46,  1.11s/it, v_num=73vx, train/loss=2.2\r",
-      "Epoch 0:   3%| | 465/15526 [08:36<4:38:46,  1.11s/it, v_num=73vx, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 466/15526 [08:37<4:38:48,  1.11s/it, v_num=73vx, train/loss=1.1\r",
-      "Epoch 0:   3%| | 466/15526 [08:37<4:38:49,  1.11s/it, v_num=73vx, train/loss=2.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 467/15526 [08:38<4:38:34,  1.11s/it, v_num=73vx, train/loss=2.7\r",
-      "Epoch 0:   3%| | 467/15526 [08:38<4:38:34,  1.11s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 468/15526 [08:39<4:38:18,  1.11s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   3%| | 468/15526 [08:39<4:38:18,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 469/15526 [08:39<4:38:04,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 469/15526 [08:39<4:38:04,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 470/15526 [08:40<4:37:49,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 470/15526 [08:40<4:37:49,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 471/15526 [08:41<4:37:50,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 471/15526 [08:41<4:37:50,  1.11s/it, v_num=73vx, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 472/15526 [08:42<4:37:53,  1.11s/it, v_num=73vx, train/loss=1.3\r",
-      "Epoch 0:   3%| | 472/15526 [08:42<4:37:53,  1.11s/it, v_num=73vx, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 473/15526 [08:43<4:37:54,  1.11s/it, v_num=73vx, train/loss=1.8\r",
-      "Epoch 0:   3%| | 473/15526 [08:43<4:37:54,  1.11s/it, v_num=73vx, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 474/15526 [08:44<4:37:40,  1.11s/it, v_num=73vx, train/loss=1.1\r",
-      "Epoch 0:   3%| | 474/15526 [08:44<4:37:40,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 475/15526 [08:45<4:37:42,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 475/15526 [08:45<4:37:42,  1.11s/it, v_num=73vx, train/loss=2.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 476/15526 [08:46<4:37:27,  1.11s/it, v_num=73vx, train/loss=2.6\r",
-      "Epoch 0:   3%| | 476/15526 [08:46<4:37:27,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 477/15526 [08:47<4:37:12,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   3%| | 477/15526 [08:47<4:37:12,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 478/15526 [08:47<4:36:58,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 478/15526 [08:47<4:36:58,  1.10s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 479/15526 [08:49<4:37:00,  1.10s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   3%| | 479/15526 [08:49<4:37:00,  1.10s/it, v_num=73vx, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 480/15526 [08:55<4:39:52,  1.12s/it, v_num=73vx, train/loss=1.4\r",
-      "Epoch 0:   3%| | 480/15526 [08:55<4:39:52,  1.12s/it, v_num=73vx, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 481/15526 [08:56<4:39:38,  1.12s/it, v_num=73vx, train/loss=2.1\r",
-      "Epoch 0:   3%| | 481/15526 [08:56<4:39:38,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 482/15526 [08:57<4:39:23,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 482/15526 [08:57<4:39:23,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 483/15526 [08:57<4:39:09,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 483/15526 [08:57<4:39:09,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 484/15526 [08:58<4:38:54,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 484/15526 [08:58<4:38:54,  1.11s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 485/15526 [08:59<4:38:40,  1.11s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   3%| | 485/15526 [08:59<4:38:40,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 486/15526 [08:59<4:38:25,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 486/15526 [08:59<4:38:25,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 487/15526 [09:00<4:38:11,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 487/15526 [09:00<4:38:11,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 488/15526 [09:01<4:38:14,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 488/15526 [09:01<4:38:14,  1.11s/it, v_num=73vx, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 489/15526 [09:02<4:38:00,  1.11s/it, v_num=73vx, train/loss=2.2\r",
-      "Epoch 0:   3%| | 489/15526 [09:02<4:38:00,  1.11s/it, v_num=73vx, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 490/15526 [09:03<4:37:46,  1.11s/it, v_num=73vx, train/loss=0.9\r",
-      "Epoch 0:   3%| | 490/15526 [09:03<4:37:46,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 491/15526 [09:03<4:37:33,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 491/15526 [09:03<4:37:33,  1.11s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 492/15526 [09:05<4:37:34,  1.11s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   3%| | 492/15526 [09:05<4:37:34,  1.11s/it, v_num=73vx, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 493/15526 [09:05<4:37:20,  1.11s/it, v_num=73vx, train/loss=1.2\r",
-      "Epoch 0:   3%| | 493/15526 [09:05<4:37:20,  1.11s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 494/15526 [09:06<4:37:06,  1.11s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   3%| | 494/15526 [09:06<4:37:06,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 495/15526 [09:07<4:36:53,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 495/15526 [09:07<4:36:53,  1.11s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 496/15526 [09:07<4:36:39,  1.10s/it, v_num=73vx, train/loss=0.7\r",
-      "Epoch 0:   3%| | 496/15526 [09:07<4:36:39,  1.10s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 497/15526 [09:09<4:36:41,  1.10s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   3%| | 497/15526 [09:09<4:36:41,  1.10s/it, v_num=73vx, train/loss=2.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 498/15526 [09:09<4:36:27,  1.10s/it, v_num=73vx, train/loss=2.7\r",
-      "Epoch 0:   3%| | 498/15526 [09:09<4:36:27,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 499/15526 [09:10<4:36:29,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 499/15526 [09:10<4:36:29,  1.10s/it, v_num=73vx, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 500/15526 [09:11<4:36:15,  1.10s/it, v_num=73vx, train/loss=1.7\r",
-      "Epoch 0:   3%| | 500/15526 [09:11<4:36:15,  1.10s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 501/15526 [09:12<4:36:02,  1.10s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   3%| | 501/15526 [09:12<4:36:02,  1.10s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 502/15526 [09:13<4:36:04,  1.10s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   3%| | 502/15526 [09:13<4:36:04,  1.10s/it, v_num=73vx, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 503/15526 [09:14<4:36:05,  1.10s/it, v_num=73vx, train/loss=2.2\r",
-      "Epoch 0:   3%| | 503/15526 [09:14<4:36:05,  1.10s/it, v_num=73vx, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 504/15526 [09:15<4:35:51,  1.10s/it, v_num=73vx, train/loss=1.5\r",
-      "Epoch 0:   3%| | 504/15526 [09:15<4:35:51,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 505/15526 [09:15<4:35:37,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 505/15526 [09:15<4:35:37,  1.10s/it, v_num=73vx, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 506/15526 [09:17<4:35:38,  1.10s/it, v_num=73vx, train/loss=0.6\r",
-      "Epoch 0:   3%| | 506/15526 [09:17<4:35:38,  1.10s/it, v_num=73vx, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 507/15526 [09:17<4:35:25,  1.10s/it, v_num=73vx, train/loss=1.5\r",
-      "Epoch 0:   3%| | 507/15526 [09:17<4:35:25,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 508/15526 [09:18<4:35:11,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 508/15526 [09:18<4:35:11,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 509/15526 [09:19<4:34:57,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 509/15526 [09:19<4:34:57,  1.10s/it, v_num=73vx, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 510/15526 [09:20<4:34:58,  1.10s/it, v_num=73vx, train/loss=0.6\r",
-      "Epoch 0:   3%| | 510/15526 [09:20<4:34:58,  1.10s/it, v_num=73vx, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 511/15526 [09:21<4:34:45,  1.10s/it, v_num=73vx, train/loss=1.6\r",
-      "Epoch 0:   3%| | 511/15526 [09:21<4:34:45,  1.10s/it, v_num=73vx, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 512/15526 [09:29<4:38:25,  1.11s/it, v_num=73vx, train/loss=0.9\r",
-      "Epoch 0:   3%| | 512/15526 [09:29<4:38:25,  1.11s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 513/15526 [09:30<4:38:11,  1.11s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   3%| | 513/15526 [09:30<4:38:11,  1.11s/it, v_num=73vx, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 514/15526 [09:31<4:37:58,  1.11s/it, v_num=73vx, train/loss=0.8\r",
-      "Epoch 0:   3%| | 514/15526 [09:31<4:37:58,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 515/15526 [09:31<4:37:44,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   3%| | 515/15526 [09:31<4:37:44,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 516/15526 [09:32<4:37:30,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 516/15526 [09:32<4:37:30,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 517/15526 [09:33<4:37:17,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 517/15526 [09:33<4:37:17,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 518/15526 [09:33<4:37:03,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 518/15526 [09:33<4:37:03,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 519/15526 [09:34<4:36:50,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 519/15526 [09:34<4:36:50,  1.11s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 520/15526 [09:35<4:36:52,  1.11s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   3%| | 520/15526 [09:35<4:36:52,  1.11s/it, v_num=73vx, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 521/15526 [09:36<4:36:38,  1.11s/it, v_num=73vx, train/loss=1.3\r",
-      "Epoch 0:   3%| | 521/15526 [09:36<4:36:38,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 522/15526 [09:37<4:36:40,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 522/15526 [09:37<4:36:40,  1.11s/it, v_num=73vx, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 523/15526 [09:38<4:36:44,  1.11s/it, v_num=73vx, train/loss=1.0\r",
-      "Epoch 0:   3%| | 523/15526 [09:38<4:36:44,  1.11s/it, v_num=73vx, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 524/15526 [09:39<4:36:30,  1.11s/it, v_num=73vx, train/loss=2.1\r",
-      "Epoch 0:   3%| | 524/15526 [09:39<4:36:30,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 525/15526 [09:40<4:36:34,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 525/15526 [09:40<4:36:34,  1.11s/it, v_num=73vx, train/loss=2.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 526/15526 [09:41<4:36:21,  1.11s/it, v_num=73vx, train/loss=2.4\r",
-      "Epoch 0:   3%| | 526/15526 [09:41<4:36:21,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 527/15526 [09:42<4:36:23,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 527/15526 [09:42<4:36:23,  1.11s/it, v_num=73vx, train/loss=2.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 528/15526 [09:43<4:36:10,  1.10s/it, v_num=73vx, train/loss=2.6\r",
-      "Epoch 0:   3%| | 528/15526 [09:43<4:36:10,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 529/15526 [09:44<4:36:12,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 529/15526 [09:44<4:36:12,  1.11s/it, v_num=73vx, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 530/15526 [09:45<4:36:14,  1.11s/it, v_num=73vx, train/loss=0.9\r",
-      "Epoch 0:   3%| | 530/15526 [09:45<4:36:14,  1.11s/it, v_num=73vx, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 531/15526 [09:46<4:36:01,  1.10s/it, v_num=73vx, train/loss=2.2\r",
-      "Epoch 0:   3%| | 531/15526 [09:46<4:36:01,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 532/15526 [09:47<4:35:48,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 532/15526 [09:47<4:35:48,  1.10s/it, v_num=73vx, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 533/15526 [09:47<4:35:35,  1.10s/it, v_num=73vx, train/loss=0.8\r",
-      "Epoch 0:   3%| | 533/15526 [09:47<4:35:35,  1.10s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 534/15526 [09:48<4:35:23,  1.10s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   3%| | 534/15526 [09:48<4:35:23,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 535/15526 [09:49<4:35:10,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 535/15526 [09:49<4:35:10,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 536/15526 [09:50<4:35:12,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 536/15526 [09:50<4:35:12,  1.10s/it, v_num=73vx, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 537/15526 [09:51<4:35:00,  1.10s/it, v_num=73vx, train/loss=2.0\r",
-      "Epoch 0:   3%| | 537/15526 [09:51<4:35:00,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 538/15526 [09:52<4:35:02,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 538/15526 [09:52<4:35:02,  1.10s/it, v_num=73vx, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 539/15526 [09:53<4:34:50,  1.10s/it, v_num=73vx, train/loss=2.1\r",
-      "Epoch 0:   3%| | 539/15526 [09:53<4:34:50,  1.10s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 540/15526 [09:53<4:34:37,  1.10s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   3%| | 540/15526 [09:53<4:34:37,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 541/15526 [09:54<4:34:24,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 541/15526 [09:54<4:34:24,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 542/15526 [09:55<4:34:12,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   3%| | 542/15526 [09:55<4:34:12,  1.10s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 543/15526 [09:55<4:34:00,  1.10s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   3%| | 543/15526 [09:55<4:34:00,  1.10s/it, v_num=73vx, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 544/15526 [10:06<4:38:17,  1.11s/it, v_num=73vx, train/loss=0.8\r",
-      "Epoch 0:   4%| | 544/15526 [10:06<4:38:17,  1.11s/it, v_num=73vx, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 545/15526 [10:06<4:38:04,  1.11s/it, v_num=73vx, train/loss=2.0\r",
-      "Epoch 0:   4%| | 545/15526 [10:06<4:38:04,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 546/15526 [10:07<4:37:51,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 546/15526 [10:07<4:37:51,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 547/15526 [10:08<4:37:53,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   4%| | 547/15526 [10:08<4:37:53,  1.11s/it, v_num=73vx, train/loss=2.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 548/15526 [10:10<4:37:54,  1.11s/it, v_num=73vx, train/loss=2.4\r",
-      "Epoch 0:   4%| | 548/15526 [10:10<4:37:54,  1.11s/it, v_num=73vx, train/loss=2.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 549/15526 [10:10<4:37:41,  1.11s/it, v_num=73vx, train/loss=2.8\r",
-      "Epoch 0:   4%| | 549/15526 [10:10<4:37:41,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 550/15526 [10:11<4:37:28,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 550/15526 [10:11<4:37:28,  1.11s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 551/15526 [10:12<4:37:15,  1.11s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   4%| | 551/15526 [10:12<4:37:15,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 552/15526 [10:12<4:37:02,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 552/15526 [10:12<4:37:02,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 553/15526 [10:13<4:36:49,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 553/15526 [10:13<4:36:49,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 554/15526 [10:14<4:36:36,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 554/15526 [10:14<4:36:36,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 555/15526 [10:15<4:36:37,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 555/15526 [10:15<4:36:37,  1.11s/it, v_num=73vx, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 556/15526 [10:16<4:36:38,  1.11s/it, v_num=73vx, train/loss=1.8\r",
-      "Epoch 0:   4%| | 556/15526 [10:16<4:36:38,  1.11s/it, v_num=73vx, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 557/15526 [10:17<4:36:39,  1.11s/it, v_num=73vx, train/loss=1.4\r",
-      "Epoch 0:   4%| | 557/15526 [10:17<4:36:39,  1.11s/it, v_num=73vx, train/loss=2.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 558/15526 [10:18<4:36:26,  1.11s/it, v_num=73vx, train/loss=2.7\r",
-      "Epoch 0:   4%| | 558/15526 [10:18<4:36:26,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 559/15526 [10:19<4:36:27,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 559/15526 [10:19<4:36:27,  1.11s/it, v_num=73vx, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 560/15526 [10:20<4:36:14,  1.11s/it, v_num=73vx, train/loss=0.8\r",
-      "Epoch 0:   4%| | 560/15526 [10:20<4:36:14,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 561/15526 [10:21<4:36:15,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 561/15526 [10:21<4:36:15,  1.11s/it, v_num=73vx, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 562/15526 [10:22<4:36:16,  1.11s/it, v_num=73vx, train/loss=1.7\r",
-      "Epoch 0:   4%| | 562/15526 [10:22<4:36:16,  1.11s/it, v_num=73vx, train/loss=2.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 563/15526 [10:23<4:36:04,  1.11s/it, v_num=73vx, train/loss=2.3\r",
-      "Epoch 0:   4%| | 563/15526 [10:23<4:36:04,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 564/15526 [10:24<4:36:05,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 564/15526 [10:24<4:36:05,  1.11s/it, v_num=73vx, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 565/15526 [10:25<4:35:52,  1.11s/it, v_num=73vx, train/loss=2.5\r",
-      "Epoch 0:   4%| | 565/15526 [10:25<4:35:53,  1.11s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 566/15526 [10:25<4:35:40,  1.11s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   4%| | 566/15526 [10:25<4:35:40,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 567/15526 [10:26<4:35:27,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 567/15526 [10:26<4:35:27,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 568/15526 [10:27<4:35:27,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 568/15526 [10:27<4:35:27,  1.10s/it, v_num=73vx, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 569/15526 [10:28<4:35:15,  1.10s/it, v_num=73vx, train/loss=1.1\r",
-      "Epoch 0:   4%| | 569/15526 [10:28<4:35:15,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 570/15526 [10:28<4:35:02,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 570/15526 [10:28<4:35:02,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 571/15526 [10:29<4:34:49,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 571/15526 [10:29<4:34:49,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 572/15526 [10:30<4:34:36,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 572/15526 [10:30<4:34:36,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 573/15526 [10:30<4:34:24,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 573/15526 [10:30<4:34:24,  1.10s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 574/15526 [10:32<4:34:24,  1.10s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   4%| | 574/15526 [10:32<4:34:24,  1.10s/it, v_num=73vx, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 575/15526 [10:32<4:34:12,  1.10s/it, v_num=73vx, train/loss=2.5\r",
-      "Epoch 0:   4%| | 575/15526 [10:32<4:34:12,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 576/15526 [10:41<4:37:41,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 576/15526 [10:41<4:37:41,  1.11s/it, v_num=73vx, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 577/15526 [10:42<4:37:28,  1.11s/it, v_num=73vx, train/loss=3.5\r",
-      "Epoch 0:   4%| | 577/15526 [10:42<4:37:28,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 578/15526 [10:43<4:37:29,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 578/15526 [10:43<4:37:29,  1.11s/it, v_num=73vx, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 579/15526 [10:44<4:37:29,  1.11s/it, v_num=73vx, train/loss=2.2\r",
-      "Epoch 0:   4%| | 579/15526 [10:44<4:37:29,  1.11s/it, v_num=73vx, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 580/15526 [10:45<4:37:16,  1.11s/it, v_num=73vx, train/loss=1.5\r",
-      "Epoch 0:   4%| | 580/15526 [10:45<4:37:16,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 581/15526 [10:46<4:37:04,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 581/15526 [10:46<4:37:04,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 582/15526 [10:47<4:37:04,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 582/15526 [10:47<4:37:04,  1.11s/it, v_num=73vx, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 583/15526 [10:48<4:36:52,  1.11s/it, v_num=73vx, train/loss=1.6\r",
-      "Epoch 0:   4%| | 583/15526 [10:48<4:36:52,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 584/15526 [10:48<4:36:39,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 584/15526 [10:48<4:36:39,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 585/15526 [10:49<4:36:26,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 585/15526 [10:49<4:36:26,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 586/15526 [10:50<4:36:14,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 586/15526 [10:50<4:36:14,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 587/15526 [10:50<4:36:01,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 587/15526 [10:50<4:36:01,  1.11s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 588/15526 [10:51<4:35:49,  1.11s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   4%| | 588/15526 [10:51<4:35:49,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 589/15526 [10:52<4:35:50,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 589/15526 [10:52<4:35:50,  1.11s/it, v_num=73vx, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 590/15526 [10:53<4:35:38,  1.11s/it, v_num=73vx, train/loss=2.2\r",
-      "Epoch 0:   4%| | 590/15526 [10:53<4:35:38,  1.11s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 591/15526 [10:54<4:35:39,  1.11s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   4%| | 591/15526 [10:54<4:35:39,  1.11s/it, v_num=73vx, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 592/15526 [10:55<4:35:26,  1.11s/it, v_num=73vx, train/loss=1.9\r",
-      "Epoch 0:   4%| | 592/15526 [10:55<4:35:26,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 593/15526 [10:55<4:35:14,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 593/15526 [10:55<4:35:14,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 594/15526 [10:56<4:35:15,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   4%| | 594/15526 [10:56<4:35:15,  1.11s/it, v_num=73vx, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 595/15526 [10:57<4:35:03,  1.11s/it, v_num=73vx, train/loss=1.7\r",
-      "Epoch 0:   4%| | 595/15526 [10:57<4:35:03,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 596/15526 [10:58<4:35:03,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 596/15526 [10:58<4:35:03,  1.11s/it, v_num=73vx, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 597/15526 [10:59<4:35:04,  1.11s/it, v_num=73vx, train/loss=2.2\r",
-      "Epoch 0:   4%| | 597/15526 [10:59<4:35:04,  1.11s/it, v_num=73vx, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 598/15526 [11:00<4:34:51,  1.10s/it, v_num=73vx, train/loss=1.4\r",
-      "Epoch 0:   4%| | 598/15526 [11:00<4:34:51,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 599/15526 [11:01<4:34:52,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 599/15526 [11:01<4:34:52,  1.10s/it, v_num=73vx, train/loss=2.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 600/15526 [11:02<4:34:52,  1.10s/it, v_num=73vx, train/loss=2.4\r",
-      "Epoch 0:   4%| | 600/15526 [11:02<4:34:52,  1.10s/it, v_num=73vx, train/loss=2.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 601/15526 [11:04<4:34:53,  1.11s/it, v_num=73vx, train/loss=2.8\r",
-      "Epoch 0:   4%| | 601/15526 [11:04<4:34:53,  1.11s/it, v_num=73vx, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 602/15526 [11:04<4:34:40,  1.10s/it, v_num=73vx, train/loss=2.2\r",
-      "Epoch 0:   4%| | 602/15526 [11:04<4:34:40,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 603/15526 [11:05<4:34:40,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 603/15526 [11:05<4:34:40,  1.10s/it, v_num=73vx, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 604/15526 [11:06<4:34:28,  1.10s/it, v_num=73vx, train/loss=0.9\r",
-      "Epoch 0:   4%| | 604/15526 [11:06<4:34:28,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 605/15526 [11:07<4:34:16,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 605/15526 [11:07<4:34:16,  1.10s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 606/15526 [11:07<4:34:04,  1.10s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   4%| | 606/15526 [11:07<4:34:04,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 607/15526 [11:09<4:34:04,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 607/15526 [11:09<4:34:04,  1.10s/it, v_num=73vx, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 608/15526 [11:17<4:37:14,  1.12s/it, v_num=73vx, train/loss=1.3\r",
-      "Epoch 0:   4%| | 608/15526 [11:17<4:37:14,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 609/15526 [11:18<4:37:01,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 609/15526 [11:18<4:37:01,  1.11s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 610/15526 [11:19<4:37:01,  1.11s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   4%| | 610/15526 [11:19<4:37:01,  1.11s/it, v_num=73vx, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 611/15526 [11:20<4:37:01,  1.11s/it, v_num=73vx, train/loss=2.2\r",
-      "Epoch 0:   4%| | 611/15526 [11:20<4:37:01,  1.11s/it, v_num=73vx, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 612/15526 [11:21<4:36:49,  1.11s/it, v_num=73vx, train/loss=1.6\r",
-      "Epoch 0:   4%| | 612/15526 [11:21<4:36:49,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 613/15526 [11:22<4:36:49,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   4%| | 613/15526 [11:22<4:36:49,  1.11s/it, v_num=73vx, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 614/15526 [11:23<4:36:49,  1.11s/it, v_num=73vx, train/loss=2.2\r",
-      "Epoch 0:   4%| | 614/15526 [11:23<4:36:49,  1.11s/it, v_num=73vx, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 615/15526 [11:24<4:36:36,  1.11s/it, v_num=73vx, train/loss=2.2\r",
-      "Epoch 0:   4%| | 615/15526 [11:24<4:36:36,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 616/15526 [11:25<4:36:24,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 616/15526 [11:25<4:36:25,  1.11s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 617/15526 [11:25<4:36:12,  1.11s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   4%| | 617/15526 [11:25<4:36:12,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 618/15526 [11:26<4:36:00,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 618/15526 [11:26<4:36:00,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 619/15526 [11:27<4:35:48,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 619/15526 [11:27<4:35:48,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 620/15526 [11:28<4:35:48,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 620/15526 [11:28<4:35:48,  1.11s/it, v_num=73vx, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 621/15526 [11:28<4:35:36,  1.11s/it, v_num=73vx, train/loss=1.5\r",
-      "Epoch 0:   4%| | 621/15526 [11:28<4:35:36,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 622/15526 [11:29<4:35:24,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 622/15526 [11:29<4:35:24,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 623/15526 [11:30<4:35:12,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 623/15526 [11:30<4:35:12,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 624/15526 [11:31<4:35:12,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 624/15526 [11:31<4:35:12,  1.11s/it, v_num=73vx, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 625/15526 [11:32<4:35:12,  1.11s/it, v_num=73vx, train/loss=1.5\r",
-      "Epoch 0:   4%| | 625/15526 [11:32<4:35:12,  1.11s/it, v_num=73vx, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 626/15526 [11:33<4:35:00,  1.11s/it, v_num=73vx, train/loss=0.9\r",
-      "Epoch 0:   4%| | 626/15526 [11:33<4:35:00,  1.11s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 627/15526 [11:34<4:35:00,  1.11s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   4%| | 627/15526 [11:34<4:35:01,  1.11s/it, v_num=73vx, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 628/15526 [11:35<4:34:49,  1.11s/it, v_num=73vx, train/loss=1.5\r",
-      "Epoch 0:   4%| | 628/15526 [11:35<4:34:49,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 629/15526 [11:35<4:34:37,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 629/15526 [11:35<4:34:37,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 630/15526 [11:36<4:34:25,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 630/15526 [11:36<4:34:25,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 631/15526 [11:37<4:34:13,  1.10s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   4%| | 631/15526 [11:37<4:34:13,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 632/15526 [11:37<4:34:02,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 632/15526 [11:37<4:34:02,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 633/15526 [11:38<4:34:04,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 633/15526 [11:38<4:34:04,  1.10s/it, v_num=73vx, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 634/15526 [11:39<4:33:54,  1.10s/it, v_num=73vx, train/loss=1.8\r",
-      "Epoch 0:   4%| | 634/15526 [11:39<4:33:54,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 635/15526 [11:40<4:33:44,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 635/15526 [11:40<4:33:44,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 636/15526 [11:41<4:33:46,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 636/15526 [11:41<4:33:46,  1.10s/it, v_num=73vx, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 637/15526 [11:42<4:33:35,  1.10s/it, v_num=73vx, train/loss=1.1\r",
-      "Epoch 0:   4%| | 637/15526 [11:42<4:33:35,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 638/15526 [11:43<4:33:24,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 638/15526 [11:43<4:33:24,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 639/15526 [11:44<4:33:26,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 639/15526 [11:44<4:33:26,  1.10s/it, v_num=73vx, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 640/15526 [11:53<4:36:43,  1.12s/it, v_num=73vx, train/loss=1.0\r",
-      "Epoch 0:   4%| | 640/15526 [11:53<4:36:43,  1.12s/it, v_num=73vx, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 641/15526 [11:54<4:36:32,  1.11s/it, v_num=73vx, train/loss=2.0\r",
-      "Epoch 0:   4%| | 641/15526 [11:54<4:36:32,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 642/15526 [11:55<4:36:34,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   4%| | 642/15526 [11:55<4:36:34,  1.11s/it, v_num=73vx, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 643/15526 [11:56<4:36:22,  1.11s/it, v_num=73vx, train/loss=1.9\r",
-      "Epoch 0:   4%| | 643/15526 [11:56<4:36:23,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 644/15526 [11:57<4:36:11,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 644/15526 [11:57<4:36:11,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 645/15526 [11:57<4:36:01,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 645/15526 [11:57<4:36:01,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 646/15526 [11:59<4:36:01,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   4%| | 646/15526 [11:59<4:36:01,  1.11s/it, v_num=73vx, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 647/15526 [12:00<4:36:02,  1.11s/it, v_num=73vx, train/loss=1.3\r",
-      "Epoch 0:   4%| | 647/15526 [12:00<4:36:02,  1.11s/it, v_num=73vx, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 648/15526 [12:00<4:35:51,  1.11s/it, v_num=73vx, train/loss=1.2\r",
-      "Epoch 0:   4%| | 648/15526 [12:00<4:35:51,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 649/15526 [12:02<4:35:52,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 649/15526 [12:02<4:35:52,  1.11s/it, v_num=73vx, train/loss=2.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 650/15526 [12:02<4:35:42,  1.11s/it, v_num=73vx, train/loss=2.7\r",
-      "Epoch 0:   4%| | 650/15526 [12:02<4:35:42,  1.11s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 651/15526 [12:03<4:35:31,  1.11s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   4%| | 651/15526 [12:03<4:35:31,  1.11s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 652/15526 [12:04<4:35:32,  1.11s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   4%| | 652/15526 [12:04<4:35:32,  1.11s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 653/15526 [12:05<4:35:34,  1.11s/it, v_num=73vx, train/loss=0.7\r",
-      "Epoch 0:   4%| | 653/15526 [12:05<4:35:34,  1.11s/it, v_num=73vx, train/loss=2.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 654/15526 [12:06<4:35:23,  1.11s/it, v_num=73vx, train/loss=2.3\r",
-      "Epoch 0:   4%| | 654/15526 [12:06<4:35:23,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 655/15526 [12:07<4:35:12,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 655/15526 [12:07<4:35:12,  1.11s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 656/15526 [12:07<4:35:01,  1.11s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   4%| | 656/15526 [12:07<4:35:01,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 657/15526 [12:09<4:35:01,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 657/15526 [12:09<4:35:01,  1.11s/it, v_num=73vx, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 658/15526 [12:09<4:34:50,  1.11s/it, v_num=73vx, train/loss=2.2\r",
-      "Epoch 0:   4%| | 658/15526 [12:09<4:34:50,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 659/15526 [12:10<4:34:39,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 659/15526 [12:10<4:34:39,  1.11s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 660/15526 [12:11<4:34:40,  1.11s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   4%| | 660/15526 [12:11<4:34:40,  1.11s/it, v_num=73vx, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 661/15526 [12:12<4:34:41,  1.11s/it, v_num=73vx, train/loss=1.4\r",
-      "Epoch 0:   4%| | 661/15526 [12:12<4:34:41,  1.11s/it, v_num=73vx, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 662/15526 [12:13<4:34:30,  1.11s/it, v_num=73vx, train/loss=2.1\r",
-      "Epoch 0:   4%| | 662/15526 [12:13<4:34:30,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 663/15526 [12:14<4:34:19,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 663/15526 [12:14<4:34:19,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 664/15526 [12:14<4:34:08,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 664/15526 [12:14<4:34:08,  1.11s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 665/15526 [12:15<4:33:57,  1.11s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   4%| | 665/15526 [12:15<4:33:57,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 666/15526 [12:16<4:33:58,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   4%| | 666/15526 [12:16<4:33:58,  1.11s/it, v_num=73vx, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 667/15526 [12:17<4:33:47,  1.11s/it, v_num=73vx, train/loss=1.1\r",
-      "Epoch 0:   4%| | 667/15526 [12:17<4:33:47,  1.11s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 668/15526 [12:18<4:33:47,  1.11s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   4%| | 668/15526 [12:18<4:33:47,  1.11s/it, v_num=73vx, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 669/15526 [12:19<4:33:37,  1.11s/it, v_num=73vx, train/loss=0.9\r",
-      "Epoch 0:   4%| | 669/15526 [12:19<4:33:37,  1.11s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 670/15526 [12:19<4:33:26,  1.10s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   4%| | 670/15526 [12:19<4:33:26,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 671/15526 [12:21<4:33:26,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 671/15526 [12:21<4:33:26,  1.10s/it, v_num=73vx, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 672/15526 [12:28<4:35:35,  1.11s/it, v_num=73vx, train/loss=1.5\r",
-      "Epoch 0:   4%| | 672/15526 [12:28<4:35:35,  1.11s/it, v_num=73vx, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 673/15526 [12:28<4:35:24,  1.11s/it, v_num=73vx, train/loss=2.2\r",
-      "Epoch 0:   4%| | 673/15526 [12:28<4:35:24,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 674/15526 [12:29<4:35:12,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 674/15526 [12:29<4:35:12,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 675/15526 [12:30<4:35:13,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 675/15526 [12:30<4:35:13,  1.11s/it, v_num=73vx, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 676/15526 [12:31<4:35:01,  1.11s/it, v_num=73vx, train/loss=1.8\r",
-      "Epoch 0:   4%| | 676/15526 [12:31<4:35:01,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 677/15526 [12:31<4:34:51,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 677/15526 [12:31<4:34:51,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 678/15526 [12:33<4:34:52,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 678/15526 [12:33<4:34:52,  1.11s/it, v_num=73vx, train/loss=2.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 679/15526 [12:33<4:34:42,  1.11s/it, v_num=73vx, train/loss=2.3\r",
-      "Epoch 0:   4%| | 679/15526 [12:33<4:34:42,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 680/15526 [12:34<4:34:31,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 680/15526 [12:34<4:34:31,  1.11s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 681/15526 [12:35<4:34:21,  1.11s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   4%| | 681/15526 [12:35<4:34:21,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 682/15526 [12:35<4:34:10,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   4%| | 682/15526 [12:35<4:34:10,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 683/15526 [12:36<4:34:00,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 683/15526 [12:36<4:34:01,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 684/15526 [12:37<4:33:50,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 684/15526 [12:37<4:33:50,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 685/15526 [12:37<4:33:40,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 685/15526 [12:37<4:33:40,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 686/15526 [12:39<4:33:40,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 686/15526 [12:39<4:33:40,  1.11s/it, v_num=73vx, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 687/15526 [12:39<4:33:30,  1.11s/it, v_num=73vx, train/loss=1.6\r",
-      "Epoch 0:   4%| | 687/15526 [12:39<4:33:30,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 688/15526 [12:40<4:33:20,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 688/15526 [12:40<4:33:20,  1.11s/it, v_num=73vx, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 689/15526 [12:41<4:33:20,  1.11s/it, v_num=73vx, train/loss=0.6\r",
-      "Epoch 0:   4%| | 689/15526 [12:41<4:33:20,  1.11s/it, v_num=73vx, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 690/15526 [12:42<4:33:10,  1.10s/it, v_num=73vx, train/loss=1.0\r",
-      "Epoch 0:   4%| | 690/15526 [12:42<4:33:10,  1.10s/it, v_num=73vx, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 691/15526 [12:43<4:33:12,  1.10s/it, v_num=73vx, train/loss=0.6\r",
-      "Epoch 0:   4%| | 691/15526 [12:43<4:33:12,  1.10s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 692/15526 [12:44<4:33:12,  1.11s/it, v_num=73vx, train/loss=0.7\r",
-      "Epoch 0:   4%| | 692/15526 [12:44<4:33:12,  1.11s/it, v_num=73vx, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 693/15526 [12:45<4:33:02,  1.10s/it, v_num=73vx, train/loss=1.9\r",
-      "Epoch 0:   4%| | 693/15526 [12:45<4:33:02,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 694/15526 [12:46<4:33:02,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 694/15526 [12:46<4:33:02,  1.10s/it, v_num=73vx, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 695/15526 [12:47<4:32:52,  1.10s/it, v_num=73vx, train/loss=0.8\r",
-      "Epoch 0:   4%| | 695/15526 [12:47<4:32:52,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 696/15526 [12:47<4:32:41,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 696/15526 [12:47<4:32:41,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 697/15526 [12:49<4:32:42,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   4%| | 697/15526 [12:49<4:32:42,  1.10s/it, v_num=73vx, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 698/15526 [12:50<4:32:42,  1.10s/it, v_num=73vx, train/loss=2.0\r",
-      "Epoch 0:   4%| | 698/15526 [12:50<4:32:42,  1.10s/it, v_num=73vx, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 699/15526 [12:50<4:32:32,  1.10s/it, v_num=73vx, train/loss=0.8\r",
-      "Epoch 0:   5%| | 699/15526 [12:50<4:32:32,  1.10s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 700/15526 [12:51<4:32:21,  1.10s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   5%| | 700/15526 [12:51<4:32:21,  1.10s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 701/15526 [12:52<4:32:22,  1.10s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   5%| | 701/15526 [12:52<4:32:22,  1.10s/it, v_num=73vx, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 702/15526 [12:53<4:32:11,  1.10s/it, v_num=73vx, train/loss=0.9\r",
-      "Epoch 0:   5%| | 702/15526 [12:53<4:32:11,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 703/15526 [12:54<4:32:12,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 703/15526 [12:54<4:32:12,  1.10s/it, v_num=73vx, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 704/15526 [13:03<4:34:45,  1.11s/it, v_num=73vx, train/loss=1.8\r",
-      "Epoch 0:   5%| | 704/15526 [13:03<4:34:45,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 705/15526 [13:04<4:34:45,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 705/15526 [13:04<4:34:45,  1.11s/it, v_num=73vx, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 706/15526 [13:05<4:34:45,  1.11s/it, v_num=73vx, train/loss=1.5\r",
-      "Epoch 0:   5%| | 706/15526 [13:05<4:34:45,  1.11s/it, v_num=73vx, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 707/15526 [13:05<4:34:34,  1.11s/it, v_num=73vx, train/loss=1.3\r",
-      "Epoch 0:   5%| | 707/15526 [13:05<4:34:34,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 708/15526 [13:06<4:34:23,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 708/15526 [13:06<4:34:23,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 709/15526 [13:07<4:34:13,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 709/15526 [13:07<4:34:13,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 710/15526 [13:08<4:34:13,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   5%| | 710/15526 [13:08<4:34:13,  1.11s/it, v_num=73vx, train/loss=2.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 711/15526 [13:09<4:34:13,  1.11s/it, v_num=73vx, train/loss=2.4\r",
-      "Epoch 0:   5%| | 711/15526 [13:09<4:34:13,  1.11s/it, v_num=73vx, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 712/15526 [13:10<4:34:02,  1.11s/it, v_num=73vx, train/loss=1.5\r",
-      "Epoch 0:   5%| | 712/15526 [13:10<4:34:02,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 713/15526 [13:10<4:33:52,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 713/15526 [13:10<4:33:52,  1.11s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 714/15526 [13:11<4:33:41,  1.11s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   5%| | 714/15526 [13:11<4:33:41,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 715/15526 [13:12<4:33:31,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 715/15526 [13:12<4:33:31,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 716/15526 [13:12<4:33:20,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 716/15526 [13:12<4:33:20,  1.11s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 717/15526 [13:13<4:33:10,  1.11s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   5%| | 717/15526 [13:13<4:33:10,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 718/15526 [13:14<4:33:10,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 718/15526 [13:14<4:33:10,  1.11s/it, v_num=73vx, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 719/15526 [13:15<4:33:00,  1.11s/it, v_num=73vx, train/loss=2.0\r",
-      "Epoch 0:   5%| | 719/15526 [13:15<4:33:00,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 720/15526 [13:16<4:32:49,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 720/15526 [13:16<4:32:49,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 721/15526 [13:16<4:32:39,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 721/15526 [13:16<4:32:39,  1.10s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 722/15526 [13:17<4:32:28,  1.10s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   5%| | 722/15526 [13:17<4:32:28,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 723/15526 [13:18<4:32:28,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 723/15526 [13:18<4:32:28,  1.10s/it, v_num=73vx, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 724/15526 [13:19<4:32:29,  1.10s/it, v_num=73vx, train/loss=1.4\r",
-      "Epoch 0:   5%| | 724/15526 [13:19<4:32:29,  1.10s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 725/15526 [13:20<4:32:18,  1.10s/it, v_num=73vx, train/loss=0.7\r",
-      "Epoch 0:   5%| | 725/15526 [13:20<4:32:18,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 726/15526 [13:21<4:32:18,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 726/15526 [13:21<4:32:18,  1.10s/it, v_num=73vx, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 727/15526 [13:22<4:32:08,  1.10s/it, v_num=73vx, train/loss=1.3\r",
-      "Epoch 0:   5%| | 727/15526 [13:22<4:32:08,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 728/15526 [13:22<4:31:58,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 728/15526 [13:22<4:31:58,  1.10s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 729/15526 [13:24<4:31:59,  1.10s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   5%| | 729/15526 [13:24<4:31:59,  1.10s/it, v_num=73vx, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 730/15526 [13:24<4:31:49,  1.10s/it, v_num=73vx, train/loss=1.0\r",
-      "Epoch 0:   5%| | 730/15526 [13:24<4:31:49,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 731/15526 [13:25<4:31:39,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 731/15526 [13:25<4:31:39,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 732/15526 [13:26<4:31:30,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 732/15526 [13:26<4:31:30,  1.10s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 733/15526 [13:26<4:31:20,  1.10s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   5%| | 733/15526 [13:26<4:31:20,  1.10s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 734/15526 [13:27<4:31:21,  1.10s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   5%| | 734/15526 [13:27<4:31:21,  1.10s/it, v_num=73vx, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 735/15526 [13:28<4:31:11,  1.10s/it, v_num=73vx, train/loss=1.8\r",
-      "Epoch 0:   5%| | 735/15526 [13:28<4:31:11,  1.10s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 736/15526 [13:38<4:33:58,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   5%| | 736/15526 [13:38<4:33:58,  1.11s/it, v_num=73vx, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 737/15526 [13:38<4:33:48,  1.11s/it, v_num=73vx, train/loss=1.2\r",
-      "Epoch 0:   5%| | 737/15526 [13:38<4:33:48,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 738/15526 [13:39<4:33:49,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 738/15526 [13:39<4:33:49,  1.11s/it, v_num=73vx, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 739/15526 [13:41<4:33:49,  1.11s/it, v_num=73vx, train/loss=1.3\r",
-      "Epoch 0:   5%| | 739/15526 [13:41<4:33:49,  1.11s/it, v_num=73vx, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 740/15526 [13:42<4:33:50,  1.11s/it, v_num=73vx, train/loss=0.8\r",
-      "Epoch 0:   5%| | 740/15526 [13:42<4:33:50,  1.11s/it, v_num=73vx, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 741/15526 [13:43<4:33:51,  1.11s/it, v_num=73vx, train/loss=1.9\r",
-      "Epoch 0:   5%| | 741/15526 [13:43<4:33:51,  1.11s/it, v_num=73vx, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 742/15526 [13:44<4:33:52,  1.11s/it, v_num=73vx, train/loss=2.2\r",
-      "Epoch 0:   5%| | 742/15526 [13:44<4:33:52,  1.11s/it, v_num=73vx, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 743/15526 [13:45<4:33:52,  1.11s/it, v_num=73vx, train/loss=0.8\r",
-      "Epoch 0:   5%| | 743/15526 [13:45<4:33:52,  1.11s/it, v_num=73vx, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 744/15526 [13:46<4:33:43,  1.11s/it, v_num=73vx, train/loss=0.9\r",
-      "Epoch 0:   5%| | 744/15526 [13:46<4:33:43,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 745/15526 [13:47<4:33:43,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 745/15526 [13:47<4:33:43,  1.11s/it, v_num=73vx, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 746/15526 [13:48<4:33:43,  1.11s/it, v_num=73vx, train/loss=0.9\r",
-      "Epoch 0:   5%| | 746/15526 [13:48<4:33:43,  1.11s/it, v_num=73vx, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 747/15526 [13:49<4:33:34,  1.11s/it, v_num=73vx, train/loss=1.1\r",
-      "Epoch 0:   5%| | 747/15526 [13:49<4:33:34,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 748/15526 [13:50<4:33:24,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 748/15526 [13:50<4:33:24,  1.11s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 749/15526 [13:51<4:33:15,  1.11s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   5%| | 749/15526 [13:51<4:33:15,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 750/15526 [13:52<4:33:15,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 750/15526 [13:52<4:33:15,  1.11s/it, v_num=73vx, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 751/15526 [13:52<4:33:06,  1.11s/it, v_num=73vx, train/loss=2.1\r",
-      "Epoch 0:   5%| | 751/15526 [13:52<4:33:06,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 752/15526 [13:53<4:32:56,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 752/15526 [13:53<4:32:56,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 753/15526 [13:54<4:32:47,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   5%| | 753/15526 [13:54<4:32:47,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 754/15526 [13:54<4:32:37,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 754/15526 [13:54<4:32:37,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 755/15526 [13:56<4:32:38,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 755/15526 [13:56<4:32:38,  1.11s/it, v_num=73vx, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 756/15526 [13:57<4:32:38,  1.11s/it, v_num=73vx, train/loss=0.8\r",
-      "Epoch 0:   5%| | 756/15526 [13:57<4:32:38,  1.11s/it, v_num=73vx, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 757/15526 [13:57<4:32:28,  1.11s/it, v_num=73vx, train/loss=0.9\r",
-      "Epoch 0:   5%| | 757/15526 [13:57<4:32:28,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 758/15526 [13:58<4:32:19,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 758/15526 [13:58<4:32:19,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 759/15526 [13:59<4:32:09,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   5%| | 759/15526 [13:59<4:32:09,  1.11s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 760/15526 [14:00<4:32:10,  1.11s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   5%| | 760/15526 [14:00<4:32:10,  1.11s/it, v_num=73vx, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 761/15526 [14:01<4:32:10,  1.11s/it, v_num=73vx, train/loss=1.7\r",
-      "Epoch 0:   5%| | 761/15526 [14:01<4:32:10,  1.11s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 762/15526 [14:02<4:32:01,  1.11s/it, v_num=73vx, train/loss=0.7\r",
-      "Epoch 0:   5%| | 762/15526 [14:02<4:32:01,  1.11s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 763/15526 [14:03<4:31:52,  1.10s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   5%| | 763/15526 [14:03<4:31:52,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 764/15526 [14:04<4:31:52,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 764/15526 [14:04<4:31:52,  1.11s/it, v_num=73vx, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 765/15526 [14:04<4:31:43,  1.10s/it, v_num=73vx, train/loss=1.2\r",
-      "Epoch 0:   5%| | 765/15526 [14:04<4:31:43,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 766/15526 [14:05<4:31:33,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 766/15526 [14:05<4:31:33,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 767/15526 [14:06<4:31:24,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 767/15526 [14:06<4:31:24,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 768/15526 [14:12<4:32:55,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 768/15526 [14:12<4:32:55,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 769/15526 [14:12<4:32:45,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 769/15526 [14:12<4:32:45,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 770/15526 [14:13<4:32:36,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 770/15526 [14:13<4:32:36,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 771/15526 [14:14<4:32:27,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   5%| | 771/15526 [14:14<4:32:27,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 772/15526 [14:14<4:32:17,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 772/15526 [14:14<4:32:17,  1.11s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 773/15526 [14:16<4:32:17,  1.11s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   5%| | 773/15526 [14:16<4:32:17,  1.11s/it, v_num=73vx, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 774/15526 [14:16<4:32:08,  1.11s/it, v_num=73vx, train/loss=0.6\r",
-      "Epoch 0:   5%| | 774/15526 [14:16<4:32:08,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 775/15526 [14:17<4:31:58,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 775/15526 [14:17<4:31:58,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 776/15526 [14:18<4:31:49,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 776/15526 [14:18<4:31:49,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 777/15526 [14:18<4:31:40,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 777/15526 [14:18<4:31:40,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 778/15526 [14:19<4:31:31,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 778/15526 [14:19<4:31:31,  1.10s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 779/15526 [14:20<4:31:21,  1.10s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   5%| | 779/15526 [14:20<4:31:21,  1.10s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 780/15526 [14:20<4:31:12,  1.10s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   5%| | 780/15526 [14:20<4:31:12,  1.10s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 781/15526 [14:21<4:31:03,  1.10s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   5%| | 781/15526 [14:21<4:31:03,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 782/15526 [14:22<4:30:54,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 782/15526 [14:22<4:30:54,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 783/15526 [14:23<4:30:54,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 783/15526 [14:23<4:30:54,  1.10s/it, v_num=73vx, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 784/15526 [14:24<4:30:54,  1.10s/it, v_num=73vx, train/loss=1.5\r",
-      "Epoch 0:   5%| | 784/15526 [14:24<4:30:54,  1.10s/it, v_num=73vx, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 785/15526 [14:25<4:30:44,  1.10s/it, v_num=73vx, train/loss=1.5\r",
-      "Epoch 0:   5%| | 785/15526 [14:25<4:30:44,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 786/15526 [14:26<4:30:44,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 786/15526 [14:26<4:30:44,  1.10s/it, v_num=73vx, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 787/15526 [14:26<4:30:35,  1.10s/it, v_num=73vx, train/loss=1.1\r",
-      "Epoch 0:   5%| | 787/15526 [14:26<4:30:35,  1.10s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 788/15526 [14:27<4:30:26,  1.10s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   5%| | 788/15526 [14:27<4:30:26,  1.10s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 789/15526 [14:28<4:30:26,  1.10s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   5%| | 789/15526 [14:28<4:30:26,  1.10s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 790/15526 [14:29<4:30:17,  1.10s/it, v_num=73vx, train/loss=0.7\r",
-      "Epoch 0:   5%| | 790/15526 [14:29<4:30:17,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 791/15526 [14:30<4:30:07,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 791/15526 [14:30<4:30:07,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 792/15526 [14:31<4:30:07,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 792/15526 [14:31<4:30:07,  1.10s/it, v_num=73vx, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 793/15526 [14:31<4:29:58,  1.10s/it, v_num=73vx, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 793/15526 [14:31<4:29:58,  1.10s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 794/15526 [14:33<4:29:59,  1.10s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   5%| | 794/15526 [14:33<4:29:59,  1.10s/it, v_num=73vx, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 795/15526 [14:33<4:29:49,  1.10s/it, v_num=73vx, train/loss=1.9\r",
-      "Epoch 0:   5%| | 795/15526 [14:33<4:29:49,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 796/15526 [14:34<4:29:49,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 796/15526 [14:34<4:29:49,  1.10s/it, v_num=73vx, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 797/15526 [14:35<4:29:41,  1.10s/it, v_num=73vx, train/loss=1.5\r",
-      "Epoch 0:   5%| | 797/15526 [14:35<4:29:41,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 798/15526 [14:36<4:29:32,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 798/15526 [14:36<4:29:32,  1.10s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 799/15526 [14:36<4:29:23,  1.10s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 799/15526 [14:36<4:29:23,  1.10s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 800/15526 [14:45<4:31:36,  1.11s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 800/15526 [14:45<4:31:36,  1.11s/it, v_num=73vx, train/loss=0.0/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py:1802: UserWarning: Positional args are being deprecated, use kwargs instead. Refer to https://pytorch.org/docs/master/generated/torch.nn.Module.html#torch.nn.Module.state_dict for details.\r\n",
-      "  warnings.warn(\r\n",
-      "/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py:1802: UserWarning: Positional args are being deprecated, use kwargs instead. Refer to https://pytorch.org/docs/master/generated/torch.nn.Module.html#torch.nn.Module.state_dict for details.\r\n",
-      "  warnings.warn(\r\n",
-      "/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py:1802: UserWarning: Positional args are being deprecated, use kwargs instead. Refer to https://pytorch.org/docs/master/generated/torch.nn.Module.html#torch.nn.Module.state_dict for details.\r\n",
-      "  warnings.warn(\r\n",
-      "/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py:1802: UserWarning: Positional args are being deprecated, use kwargs instead. Refer to https://pytorch.org/docs/master/generated/torch.nn.Module.html#torch.nn.Module.state_dict for details.\r\n",
-      "  warnings.warn(\r\n",
-      "/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py:1802: UserWarning: Positional args are being deprecated, use kwargs instead. Refer to https://pytorch.org/docs/master/generated/torch.nn.Module.html#torch.nn.Module.state_dict for details.\r\n",
-      "  warnings.warn(\r\n",
-      "/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py:1802: UserWarning: Positional args are being deprecated, use kwargs instead. Refer to https://pytorch.org/docs/master/generated/torch.nn.Module.html#torch.nn.Module.state_dict for details.\r\n",
-      "  warnings.warn(\r\n",
-      "/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py:1802: UserWarning: Positional args are being deprecated, use kwargs instead. Refer to https://pytorch.org/docs/master/generated/torch.nn.Module.html#torch.nn.Module.state_dict for details.\r\n",
-      "  warnings.warn(\r\n",
-      "/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py:1802: UserWarning: Positional args are being deprecated, use kwargs instead. Refer to https://pytorch.org/docs/master/generated/torch.nn.Module.html#torch.nn.Module.state_dict for details.\r\n",
-      "  warnings.warn(\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 801/15526 [14:59<4:35:40,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 801/15526 [14:59<4:35:40,  1.12s/it, v_num=73vx, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 802/15526 [15:00<4:35:31,  1.12s/it, v_num=73vx, train/loss=2.0\r",
-      "Epoch 0:   5%| | 802/15526 [15:00<4:35:31,  1.12s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 803/15526 [15:01<4:35:31,  1.12s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   5%| | 803/15526 [15:01<4:35:31,  1.12s/it, v_num=73vx, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 804/15526 [15:02<4:35:22,  1.12s/it, v_num=73vx, train/loss=2.0\r",
-      "Epoch 0:   5%| | 804/15526 [15:02<4:35:22,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 805/15526 [15:03<4:35:23,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 805/15526 [15:03<4:35:23,  1.12s/it, v_num=73vx, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 806/15526 [15:04<4:35:13,  1.12s/it, v_num=73vx, train/loss=1.0\r",
-      "Epoch 0:   5%| | 806/15526 [15:04<4:35:13,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 807/15526 [15:04<4:35:04,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 807/15526 [15:04<4:35:04,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 808/15526 [15:06<4:35:04,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 808/15526 [15:06<4:35:04,  1.12s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 809/15526 [15:06<4:34:55,  1.12s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   5%| | 809/15526 [15:06<4:34:55,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 810/15526 [15:07<4:34:46,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 810/15526 [15:07<4:34:46,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 811/15526 [15:08<4:34:47,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 811/15526 [15:08<4:34:47,  1.12s/it, v_num=73vx, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 812/15526 [15:09<4:34:38,  1.12s/it, v_num=73vx, train/loss=2.1\r",
-      "Epoch 0:   5%| | 812/15526 [15:09<4:34:38,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 813/15526 [15:10<4:34:29,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 813/15526 [15:10<4:34:29,  1.12s/it, v_num=73vx, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 814/15526 [15:11<4:34:29,  1.12s/it, v_num=73vx, train/loss=0.6\r",
-      "Epoch 0:   5%| | 814/15526 [15:11<4:34:29,  1.12s/it, v_num=73vx, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 815/15526 [15:11<4:34:20,  1.12s/it, v_num=73vx, train/loss=1.1\r",
-      "Epoch 0:   5%| | 815/15526 [15:11<4:34:20,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 816/15526 [15:12<4:34:11,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 816/15526 [15:12<4:34:11,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 817/15526 [15:13<4:34:02,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 817/15526 [15:13<4:34:02,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 818/15526 [15:14<4:34:03,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 818/15526 [15:14<4:34:03,  1.12s/it, v_num=73vx, train/loss=2.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 819/15526 [15:15<4:33:54,  1.12s/it, v_num=73vx, train/loss=2.4\r",
-      "Epoch 0:   5%| | 819/15526 [15:15<4:33:54,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 820/15526 [15:15<4:33:44,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 820/15526 [15:15<4:33:44,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 821/15526 [15:16<4:33:35,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 821/15526 [15:16<4:33:35,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 822/15526 [15:17<4:33:36,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 822/15526 [15:17<4:33:36,  1.12s/it, v_num=73vx, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 823/15526 [15:18<4:33:27,  1.12s/it, v_num=73vx, train/loss=0.8\r",
-      "Epoch 0:   5%| | 823/15526 [15:18<4:33:27,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 824/15526 [15:19<4:33:18,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 824/15526 [15:19<4:33:18,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 825/15526 [15:19<4:33:10,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 825/15526 [15:19<4:33:10,  1.11s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 826/15526 [15:20<4:33:01,  1.11s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   5%| | 826/15526 [15:20<4:33:01,  1.11s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 827/15526 [15:21<4:32:52,  1.11s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   5%| | 827/15526 [15:21<4:32:52,  1.11s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 828/15526 [15:21<4:32:44,  1.11s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   5%| | 828/15526 [15:21<4:32:44,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 829/15526 [15:22<4:32:35,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   5%| | 829/15526 [15:22<4:32:35,  1.11s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 830/15526 [15:23<4:32:26,  1.11s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   5%| | 830/15526 [15:23<4:32:26,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 831/15526 [15:23<4:32:17,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 831/15526 [15:23<4:32:17,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 832/15526 [15:34<4:34:59,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 832/15526 [15:34<4:34:59,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 833/15526 [15:35<4:34:59,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 833/15526 [15:35<4:34:59,  1.12s/it, v_num=73vx, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 834/15526 [15:36<4:34:50,  1.12s/it, v_num=73vx, train/loss=1.8\r",
-      "Epoch 0:   5%| | 834/15526 [15:36<4:34:50,  1.12s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 835/15526 [15:36<4:34:41,  1.12s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   5%| | 835/15526 [15:36<4:34:41,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 836/15526 [15:38<4:34:42,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 836/15526 [15:38<4:34:42,  1.12s/it, v_num=73vx, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 837/15526 [15:39<4:34:42,  1.12s/it, v_num=73vx, train/loss=0.9\r",
-      "Epoch 0:   5%| | 837/15526 [15:39<4:34:42,  1.12s/it, v_num=73vx, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 838/15526 [15:40<4:34:43,  1.12s/it, v_num=73vx, train/loss=1.9\r",
-      "Epoch 0:   5%| | 838/15526 [15:40<4:34:43,  1.12s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 839/15526 [15:41<4:34:43,  1.12s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   5%| | 839/15526 [15:41<4:34:43,  1.12s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 840/15526 [15:42<4:34:34,  1.12s/it, v_num=73vx, train/loss=0.7\r",
-      "Epoch 0:   5%| | 840/15526 [15:42<4:34:34,  1.12s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 841/15526 [15:43<4:34:26,  1.12s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   5%| | 841/15526 [15:43<4:34:26,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 842/15526 [15:43<4:34:16,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 842/15526 [15:43<4:34:16,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 843/15526 [15:44<4:34:16,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 843/15526 [15:44<4:34:16,  1.12s/it, v_num=73vx, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 844/15526 [15:45<4:34:07,  1.12s/it, v_num=73vx, train/loss=1.4\r",
-      "Epoch 0:   5%| | 844/15526 [15:45<4:34:07,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 845/15526 [15:46<4:33:58,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 845/15526 [15:46<4:33:58,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 846/15526 [15:46<4:33:48,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 846/15526 [15:46<4:33:49,  1.12s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 847/15526 [15:47<4:33:40,  1.12s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   5%| | 847/15526 [15:47<4:33:40,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 848/15526 [15:48<4:33:41,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 848/15526 [15:48<4:33:41,  1.12s/it, v_num=73vx, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 849/15526 [15:49<4:33:32,  1.12s/it, v_num=73vx, train/loss=1.0\r",
-      "Epoch 0:   5%| | 849/15526 [15:49<4:33:32,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 850/15526 [15:50<4:33:23,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 850/15526 [15:50<4:33:23,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 851/15526 [15:50<4:33:15,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 851/15526 [15:50<4:33:15,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 852/15526 [15:51<4:33:15,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   5%| | 852/15526 [15:51<4:33:15,  1.12s/it, v_num=73vx, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 853/15526 [15:53<4:33:16,  1.12s/it, v_num=73vx, train/loss=0.8\r",
-      "Epoch 0:   5%| | 853/15526 [15:53<4:33:16,  1.12s/it, v_num=73vx, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 854/15526 [15:53<4:33:08,  1.12s/it, v_num=73vx, train/loss=1.9\r",
-      "Epoch 0:   6%| | 854/15526 [15:53<4:33:08,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 855/15526 [15:54<4:33:00,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 855/15526 [15:54<4:33:00,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 856/15526 [15:55<4:33:00,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 856/15526 [15:55<4:33:01,  1.12s/it, v_num=73vx, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 857/15526 [15:56<4:32:52,  1.12s/it, v_num=73vx, train/loss=1.5\r",
-      "Epoch 0:   6%| | 857/15526 [15:56<4:32:52,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 858/15526 [15:57<4:32:53,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 858/15526 [15:57<4:32:53,  1.12s/it, v_num=73vx, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 859/15526 [15:58<4:32:45,  1.12s/it, v_num=73vx, train/loss=1.2\r",
-      "Epoch 0:   6%| | 859/15526 [15:58<4:32:45,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 860/15526 [15:59<4:32:45,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 860/15526 [15:59<4:32:45,  1.12s/it, v_num=73vx, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 861/15526 [16:00<4:32:45,  1.12s/it, v_num=73vx, train/loss=1.4\r",
-      "Epoch 0:   6%| | 861/15526 [16:00<4:32:45,  1.12s/it, v_num=73vx, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 862/15526 [16:02<4:32:45,  1.12s/it, v_num=73vx, train/loss=0.8\r",
-      "Epoch 0:   6%| | 862/15526 [16:02<4:32:45,  1.12s/it, v_num=73vx, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 863/15526 [16:02<4:32:36,  1.12s/it, v_num=73vx, train/loss=1.0\r",
-      "Epoch 0:   6%| | 863/15526 [16:02<4:32:36,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 864/15526 [16:09<4:34:06,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 864/15526 [16:09<4:34:06,  1.12s/it, v_num=73vx, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 865/15526 [16:09<4:33:57,  1.12s/it, v_num=73vx, train/loss=2.0\r",
-      "Epoch 0:   6%| | 865/15526 [16:09<4:33:57,  1.12s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 866/15526 [16:10<4:33:48,  1.12s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   6%| | 866/15526 [16:10<4:33:48,  1.12s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 867/15526 [16:11<4:33:48,  1.12s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   6%| | 867/15526 [16:11<4:33:48,  1.12s/it, v_num=73vx, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 868/15526 [16:12<4:33:40,  1.12s/it, v_num=73vx, train/loss=1.0\r",
-      "Epoch 0:   6%| | 868/15526 [16:12<4:33:40,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 869/15526 [16:13<4:33:31,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 869/15526 [16:13<4:33:31,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 870/15526 [16:13<4:33:22,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 870/15526 [16:13<4:33:22,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 871/15526 [16:14<4:33:22,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 871/15526 [16:14<4:33:22,  1.12s/it, v_num=73vx, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 872/15526 [16:15<4:33:13,  1.12s/it, v_num=73vx, train/loss=0.6\r",
-      "Epoch 0:   6%| | 872/15526 [16:15<4:33:13,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 873/15526 [16:16<4:33:05,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 873/15526 [16:16<4:33:05,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 874/15526 [16:16<4:32:56,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 874/15526 [16:16<4:32:56,  1.12s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 875/15526 [16:18<4:32:56,  1.12s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   6%| | 875/15526 [16:18<4:32:56,  1.12s/it, v_num=73vx, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 876/15526 [16:19<4:32:56,  1.12s/it, v_num=73vx, train/loss=0.6\r",
-      "Epoch 0:   6%| | 876/15526 [16:19<4:32:56,  1.12s/it, v_num=73vx, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 877/15526 [16:19<4:32:48,  1.12s/it, v_num=73vx, train/loss=0.9\r",
-      "Epoch 0:   6%| | 877/15526 [16:19<4:32:48,  1.12s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 878/15526 [16:21<4:32:48,  1.12s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   6%| | 878/15526 [16:21<4:32:48,  1.12s/it, v_num=73vx, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 879/15526 [16:22<4:32:48,  1.12s/it, v_num=73vx, train/loss=0.8\r",
-      "Epoch 0:   6%| | 879/15526 [16:22<4:32:48,  1.12s/it, v_num=73vx, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 880/15526 [16:22<4:32:39,  1.12s/it, v_num=73vx, train/loss=1.2\r",
-      "Epoch 0:   6%| | 880/15526 [16:22<4:32:39,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 881/15526 [16:23<4:32:31,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 881/15526 [16:23<4:32:31,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 882/15526 [16:24<4:32:22,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 882/15526 [16:24<4:32:22,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 883/15526 [16:24<4:32:14,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 883/15526 [16:24<4:32:14,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 884/15526 [16:25<4:32:05,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 884/15526 [16:25<4:32:06,  1.12s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 885/15526 [16:26<4:32:06,  1.12s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   6%| | 885/15526 [16:26<4:32:06,  1.12s/it, v_num=73vx, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 886/15526 [16:27<4:31:58,  1.11s/it, v_num=73vx, train/loss=0.6\r",
-      "Epoch 0:   6%| | 886/15526 [16:27<4:31:58,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 887/15526 [16:28<4:31:50,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 887/15526 [16:28<4:31:50,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 888/15526 [16:29<4:31:50,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 888/15526 [16:29<4:31:50,  1.11s/it, v_num=73vx, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 889/15526 [16:30<4:31:50,  1.11s/it, v_num=73vx, train/loss=1.8\r",
-      "Epoch 0:   6%| | 889/15526 [16:30<4:31:50,  1.11s/it, v_num=73vx, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 890/15526 [16:31<4:31:41,  1.11s/it, v_num=73vx, train/loss=1.8\r",
-      "Epoch 0:   6%| | 890/15526 [16:31<4:31:42,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 891/15526 [16:31<4:31:33,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 891/15526 [16:31<4:31:33,  1.11s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 892/15526 [16:32<4:31:25,  1.11s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   6%| | 892/15526 [16:32<4:31:25,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 893/15526 [16:33<4:31:16,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 893/15526 [16:33<4:31:16,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 894/15526 [16:33<4:31:08,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 894/15526 [16:33<4:31:08,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 895/15526 [16:34<4:31:00,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 895/15526 [16:34<4:31:00,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 896/15526 [16:43<4:32:57,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 896/15526 [16:43<4:32:57,  1.12s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 897/15526 [16:43<4:32:49,  1.12s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   6%| | 897/15526 [16:43<4:32:49,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 898/15526 [16:44<4:32:40,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 898/15526 [16:44<4:32:40,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 899/15526 [16:45<4:32:32,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 899/15526 [16:45<4:32:32,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 900/15526 [16:46<4:32:31,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 900/15526 [16:46<4:32:31,  1.12s/it, v_num=73vx, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 901/15526 [16:47<4:32:31,  1.12s/it, v_num=73vx, train/loss=1.6\r",
-      "Epoch 0:   6%| | 901/15526 [16:47<4:32:31,  1.12s/it, v_num=73vx, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 902/15526 [16:48<4:32:22,  1.12s/it, v_num=73vx, train/loss=1.8\r",
-      "Epoch 0:   6%| | 902/15526 [16:48<4:32:22,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 903/15526 [16:49<4:32:22,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 903/15526 [16:49<4:32:22,  1.12s/it, v_num=73vx, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 904/15526 [16:49<4:32:14,  1.12s/it, v_num=73vx, train/loss=1.3\r",
-      "Epoch 0:   6%| | 904/15526 [16:49<4:32:14,  1.12s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 905/15526 [16:50<4:32:05,  1.12s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   6%| | 905/15526 [16:50<4:32:05,  1.12s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 906/15526 [16:51<4:32:05,  1.12s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   6%| | 906/15526 [16:51<4:32:05,  1.12s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 907/15526 [16:52<4:32:05,  1.12s/it, v_num=73vx, train/loss=0.7\r",
-      "Epoch 0:   6%| | 907/15526 [16:52<4:32:05,  1.12s/it, v_num=73vx, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 908/15526 [16:53<4:31:56,  1.12s/it, v_num=73vx, train/loss=0.8\r",
-      "Epoch 0:   6%| | 908/15526 [16:53<4:31:56,  1.12s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 909/15526 [16:54<4:31:48,  1.12s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   6%| | 909/15526 [16:54<4:31:48,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 910/15526 [16:54<4:31:39,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 910/15526 [16:54<4:31:39,  1.12s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 911/15526 [16:55<4:31:31,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   6%| | 911/15526 [16:55<4:31:31,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 912/15526 [16:56<4:31:22,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 912/15526 [16:56<4:31:22,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 913/15526 [16:56<4:31:14,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 913/15526 [16:56<4:31:14,  1.11s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 914/15526 [16:57<4:31:14,  1.11s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   6%| | 914/15526 [16:57<4:31:14,  1.11s/it, v_num=73vx, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 915/15526 [16:59<4:31:14,  1.11s/it, v_num=73vx, train/loss=1.6\r",
-      "Epoch 0:   6%| | 915/15526 [16:59<4:31:14,  1.11s/it, v_num=73vx, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 916/15526 [17:00<4:31:14,  1.11s/it, v_num=73vx, train/loss=1.2\r",
-      "Epoch 0:   6%| | 916/15526 [17:00<4:31:14,  1.11s/it, v_num=73vx, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 917/15526 [17:01<4:31:13,  1.11s/it, v_num=73vx, train/loss=1.6\r",
-      "Epoch 0:   6%| | 917/15526 [17:01<4:31:13,  1.11s/it, v_num=73vx, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 918/15526 [17:02<4:31:05,  1.11s/it, v_num=73vx, train/loss=0.9\r",
-      "Epoch 0:   6%| | 918/15526 [17:02<4:31:05,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 919/15526 [17:02<4:30:57,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 919/15526 [17:02<4:30:57,  1.11s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 920/15526 [17:04<4:30:57,  1.11s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   6%| | 920/15526 [17:04<4:30:57,  1.11s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 921/15526 [17:04<4:30:49,  1.11s/it, v_num=73vx, train/loss=0.7\r",
-      "Epoch 0:   6%| | 921/15526 [17:04<4:30:49,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 922/15526 [17:05<4:30:49,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 922/15526 [17:05<4:30:49,  1.11s/it, v_num=73vx, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 923/15526 [17:07<4:30:48,  1.11s/it, v_num=73vx, train/loss=0.6\r",
-      "Epoch 0:   6%| | 923/15526 [17:07<4:30:48,  1.11s/it, v_num=73vx, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 924/15526 [17:07<4:30:40,  1.11s/it, v_num=73vx, train/loss=0.6\r",
-      "Epoch 0:   6%| | 924/15526 [17:07<4:30:40,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 925/15526 [17:08<4:30:32,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 925/15526 [17:08<4:30:32,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 926/15526 [17:09<4:30:24,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   6%| | 926/15526 [17:09<4:30:24,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 927/15526 [17:09<4:30:16,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 927/15526 [17:09<4:30:16,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 928/15526 [17:16<4:31:46,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 928/15526 [17:16<4:31:46,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 929/15526 [17:17<4:31:37,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 929/15526 [17:17<4:31:37,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 930/15526 [17:17<4:31:29,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 930/15526 [17:17<4:31:29,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 931/15526 [17:19<4:31:29,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 931/15526 [17:19<4:31:29,  1.12s/it, v_num=73vx, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 932/15526 [17:20<4:31:29,  1.12s/it, v_num=73vx, train/loss=0.6\r",
-      "Epoch 0:   6%| | 932/15526 [17:20<4:31:29,  1.12s/it, v_num=73vx, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 933/15526 [17:20<4:31:20,  1.12s/it, v_num=73vx, train/loss=1.4\r",
-      "Epoch 0:   6%| | 933/15526 [17:20<4:31:20,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 934/15526 [17:21<4:31:12,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 934/15526 [17:21<4:31:12,  1.12s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 935/15526 [17:22<4:31:04,  1.11s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   6%| | 935/15526 [17:22<4:31:04,  1.11s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 936/15526 [17:22<4:30:56,  1.11s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   6%| | 936/15526 [17:22<4:30:56,  1.11s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 937/15526 [17:23<4:30:48,  1.11s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   6%| | 937/15526 [17:23<4:30:48,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 938/15526 [17:24<4:30:48,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 938/15526 [17:24<4:30:48,  1.11s/it, v_num=73vx, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 939/15526 [17:25<4:30:40,  1.11s/it, v_num=73vx, train/loss=2.1\r",
-      "Epoch 0:   6%| | 939/15526 [17:25<4:30:40,  1.11s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 940/15526 [17:26<4:30:41,  1.11s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   6%| | 940/15526 [17:26<4:30:41,  1.11s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 941/15526 [17:27<4:30:41,  1.11s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   6%| | 941/15526 [17:27<4:30:41,  1.11s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 942/15526 [17:28<4:30:33,  1.11s/it, v_num=73vx, train/loss=0.7\r",
-      "Epoch 0:   6%| | 942/15526 [17:28<4:30:33,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 943/15526 [17:29<4:30:25,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 943/15526 [17:29<4:30:25,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 944/15526 [17:29<4:30:17,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 944/15526 [17:29<4:30:17,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 945/15526 [17:31<4:30:17,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 945/15526 [17:31<4:30:17,  1.11s/it, v_num=73vx, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 946/15526 [17:32<4:30:17,  1.11s/it, v_num=73vx, train/loss=1.8\r",
-      "Epoch 0:   6%| | 946/15526 [17:32<4:30:17,  1.11s/it, v_num=73vx, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 947/15526 [17:32<4:30:09,  1.11s/it, v_num=73vx, train/loss=2.1\r",
-      "Epoch 0:   6%| | 947/15526 [17:32<4:30:09,  1.11s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 948/15526 [17:34<4:30:09,  1.11s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   6%| | 948/15526 [17:34<4:30:09,  1.11s/it, v_num=73vx, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 949/15526 [17:34<4:30:01,  1.11s/it, v_num=73vx, train/loss=1.1\r",
-      "Epoch 0:   6%| | 949/15526 [17:34<4:30:01,  1.11s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 950/15526 [17:35<4:29:53,  1.11s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   6%| | 950/15526 [17:35<4:29:53,  1.11s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 951/15526 [17:36<4:29:45,  1.11s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   6%| | 951/15526 [17:36<4:29:45,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 952/15526 [17:37<4:29:45,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 952/15526 [17:37<4:29:45,  1.11s/it, v_num=73vx, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 953/15526 [17:37<4:29:37,  1.11s/it, v_num=73vx, train/loss=0.6\r",
-      "Epoch 0:   6%| | 953/15526 [17:37<4:29:37,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 954/15526 [17:39<4:29:37,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 954/15526 [17:39<4:29:37,  1.11s/it, v_num=73vx, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 955/15526 [17:39<4:29:29,  1.11s/it, v_num=73vx, train/loss=1.6\r",
-      "Epoch 0:   6%| | 955/15526 [17:39<4:29:29,  1.11s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 956/15526 [17:40<4:29:21,  1.11s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   6%| | 956/15526 [17:40<4:29:21,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 957/15526 [17:41<4:29:21,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 957/15526 [17:41<4:29:21,  1.11s/it, v_num=73vx, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 958/15526 [17:42<4:29:13,  1.11s/it, v_num=73vx, train/loss=1.3\r",
-      "Epoch 0:   6%| | 958/15526 [17:42<4:29:13,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 959/15526 [17:43<4:29:13,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 959/15526 [17:43<4:29:13,  1.11s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 960/15526 [17:51<4:31:04,  1.12s/it, v_num=73vx, train/loss=0.7\r",
-      "Epoch 0:   6%| | 960/15526 [17:51<4:31:05,  1.12s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 961/15526 [17:53<4:31:04,  1.12s/it, v_num=73vx, train/loss=0.7\r",
-      "Epoch 0:   6%| | 961/15526 [17:53<4:31:04,  1.12s/it, v_num=73vx, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 962/15526 [17:54<4:31:03,  1.12s/it, v_num=73vx, train/loss=1.3\r",
-      "Epoch 0:   6%| | 962/15526 [17:54<4:31:03,  1.12s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 963/15526 [17:55<4:31:03,  1.12s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   6%| | 963/15526 [17:55<4:31:03,  1.12s/it, v_num=73vx, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 964/15526 [17:56<4:31:04,  1.12s/it, v_num=73vx, train/loss=1.3\r",
-      "Epoch 0:   6%| | 964/15526 [17:56<4:31:04,  1.12s/it, v_num=73vx, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 965/15526 [17:57<4:30:56,  1.12s/it, v_num=73vx, train/loss=1.8\r",
-      "Epoch 0:   6%| | 965/15526 [17:57<4:30:56,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 966/15526 [17:58<4:30:56,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 966/15526 [17:58<4:30:56,  1.12s/it, v_num=73vx, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 967/15526 [17:59<4:30:48,  1.12s/it, v_num=73vx, train/loss=1.2\r",
-      "Epoch 0:   6%| | 967/15526 [17:59<4:30:48,  1.12s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 968/15526 [17:59<4:30:40,  1.12s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   6%| | 968/15526 [17:59<4:30:40,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 969/15526 [18:00<4:30:32,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 969/15526 [18:00<4:30:32,  1.12s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 970/15526 [18:01<4:30:32,  1.12s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   6%| | 970/15526 [18:01<4:30:32,  1.12s/it, v_num=73vx, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 971/15526 [18:03<4:30:39,  1.12s/it, v_num=73vx, train/loss=1.0\r",
-      "Epoch 0:   6%| | 971/15526 [18:03<4:30:39,  1.12s/it, v_num=73vx, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 972/15526 [18:04<4:30:39,  1.12s/it, v_num=73vx, train/loss=0.7\r",
-      "Epoch 0:   6%| | 972/15526 [18:04<4:30:39,  1.12s/it, v_num=73vx, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 973/15526 [18:05<4:30:31,  1.12s/it, v_num=73vx, train/loss=1.1\r",
-      "Epoch 0:   6%| | 973/15526 [18:05<4:30:31,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 974/15526 [18:05<4:30:24,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 974/15526 [18:05<4:30:24,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 975/15526 [18:06<4:30:16,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   6%| | 975/15526 [18:06<4:30:16,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 976/15526 [18:07<4:30:09,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 976/15526 [18:07<4:30:09,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 977/15526 [18:08<4:30:09,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 977/15526 [18:08<4:30:09,  1.11s/it, v_num=73vx, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 978/15526 [18:09<4:30:01,  1.11s/it, v_num=73vx, train/loss=0.4\r",
-      "Epoch 0:   6%| | 978/15526 [18:09<4:30:01,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 979/15526 [18:09<4:29:54,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   6%| | 979/15526 [18:09<4:29:54,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 980/15526 [18:10<4:29:47,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 980/15526 [18:10<4:29:47,  1.11s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 981/15526 [18:11<4:29:39,  1.11s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   6%| | 981/15526 [18:11<4:29:39,  1.11s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 982/15526 [18:12<4:29:40,  1.11s/it, v_num=73vx, train/loss=0.1\r",
-      "Epoch 0:   6%| | 982/15526 [18:12<4:29:40,  1.11s/it, v_num=73vx, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 983/15526 [18:13<4:29:32,  1.11s/it, v_num=73vx, train/loss=0.6\r",
-      "Epoch 0:   6%| | 983/15526 [18:13<4:29:32,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 984/15526 [18:13<4:29:25,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 984/15526 [18:13<4:29:25,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 985/15526 [18:15<4:29:25,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 985/15526 [18:15<4:29:25,  1.11s/it, v_num=73vx, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 986/15526 [18:15<4:29:18,  1.11s/it, v_num=73vx, train/loss=0.5\r",
-      "Epoch 0:   6%| | 986/15526 [18:15<4:29:18,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 987/15526 [18:16<4:29:10,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 987/15526 [18:16<4:29:10,  1.11s/it, v_num=73vx, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 988/15526 [18:17<4:29:03,  1.11s/it, v_num=73vx, train/loss=0.2\r",
-      "Epoch 0:   6%| | 988/15526 [18:17<4:29:03,  1.11s/it, v_num=73vx, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 989/15526 [18:17<4:28:56,  1.11s/it, v_num=73vx, train/loss=0.3\r",
-      "Epoch 0:   6%| | 989/15526 [18:17<4:28:56,  1.11s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 990/15526 [18:18<4:28:56,  1.11s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 990/15526 [18:18<4:28:56,  1.11s/it, v_num=73vx, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 991/15526 [18:20<4:28:56,  1.11s/it, v_num=73vx, train/loss=2.1\r",
-      "Epoch 0:   6%| | 991/15526 [18:20<4:28:56,  1.11s/it, v_num=73vx, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 992/15526 [18:29<4:30:49,  1.12s/it, v_num=73vx, train/loss=1.6\r",
-      "Epoch 0:   6%| | 992/15526 [18:29<4:30:49,  1.12s/it, v_num=73vx, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 993/15526 [18:29<4:30:41,  1.12s/it, v_num=73vx, train/loss=1.0\r",
-      "Epoch 0:   6%| | 993/15526 [18:29<4:30:41,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 994/15526 [18:30<4:30:41,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 994/15526 [18:30<4:30:41,  1.12s/it, v_num=73vx, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 995/15526 [18:32<4:30:41,  1.12s/it, v_num=73vx, train/loss=1.6\r",
-      "Epoch 0:   6%| | 995/15526 [18:32<4:30:41,  1.12s/it, v_num=73vx, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 996/15526 [18:32<4:30:34,  1.12s/it, v_num=73vx, train/loss=1.8\r",
-      "Epoch 0:   6%| | 996/15526 [18:32<4:30:34,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 997/15526 [18:34<4:30:34,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 997/15526 [18:34<4:30:34,  1.12s/it, v_num=73vx, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 998/15526 [18:34<4:30:26,  1.12s/it, v_num=73vx, train/loss=0.6\r",
-      "Epoch 0:   6%| | 998/15526 [18:34<4:30:26,  1.12s/it, v_num=73vx, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 999/15526 [18:35<4:30:19,  1.12s/it, v_num=73vx, train/loss=0.0\r",
-      "Epoch 0:   6%| | 999/15526 [18:35<4:30:19,  1.12s/it, v_num=73vx, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 1000/15526 [18:36<4:30:19,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   6%| | 1000/15526 [18:36<4:30:19,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 1001/15526 [18:37<4:30:11,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   6%| | 1001/15526 [18:37<4:30:11,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 1002/15526 [18:37<4:30:04,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   6%| | 1002/15526 [18:37<4:30:04,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 1003/15526 [18:38<4:29:57,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   6%| | 1003/15526 [18:38<4:29:57,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 1004/15526 [18:39<4:29:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   6%| | 1004/15526 [18:39<4:29:49,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 1005/15526 [18:39<4:29:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   6%| | 1005/15526 [18:39<4:29:42,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 1006/15526 [18:40<4:29:34,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   6%| | 1006/15526 [18:40<4:29:34,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 1007/15526 [18:41<4:29:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   6%| | 1007/15526 [18:41<4:29:35,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 1008/15526 [18:42<4:29:27,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   6%| | 1008/15526 [18:42<4:29:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 1009/15526 [18:43<4:29:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   6%| | 1009/15526 [18:43<4:29:20,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1010/15526 [18:43<4:29:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1010/15526 [18:43<4:29:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1011/15526 [18:44<4:29:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1011/15526 [18:44<4:29:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1012/15526 [18:45<4:29:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1012/15526 [18:45<4:29:05,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1013/15526 [18:46<4:28:58,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   7%| | 1013/15526 [18:46<4:28:58,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1014/15526 [18:47<4:28:58,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1014/15526 [18:47<4:28:58,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1015/15526 [18:48<4:28:58,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1015/15526 [18:48<4:28:58,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1016/15526 [18:49<4:28:51,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   7%| | 1016/15526 [18:49<4:28:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1017/15526 [18:50<4:28:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1017/15526 [18:50<4:28:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1018/15526 [18:50<4:28:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1018/15526 [18:50<4:28:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1019/15526 [18:52<4:28:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1019/15526 [18:52<4:28:36,  1.11s/it, v_num=73vx, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1020/15526 [18:52<4:28:29,  1.11s/it, v_num=73vx, train/loss=2.\r",
-      "Epoch 0:   7%| | 1020/15526 [18:52<4:28:29,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1021/15526 [18:53<4:28:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1021/15526 [18:53<4:28:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1022/15526 [18:54<4:28:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1022/15526 [18:54<4:28:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1023/15526 [18:54<4:28:07,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1023/15526 [18:54<4:28:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1024/15526 [19:03<4:29:53,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1024/15526 [19:03<4:29:53,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1025/15526 [19:04<4:29:45,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1025/15526 [19:04<4:29:45,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1026/15526 [19:04<4:29:38,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1026/15526 [19:04<4:29:38,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1027/15526 [19:05<4:29:31,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1027/15526 [19:05<4:29:31,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1028/15526 [19:06<4:29:23,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1028/15526 [19:06<4:29:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1029/15526 [19:06<4:29:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1029/15526 [19:06<4:29:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1030/15526 [19:07<4:29:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1030/15526 [19:07<4:29:16,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1031/15526 [19:08<4:29:09,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   7%| | 1031/15526 [19:08<4:29:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1032/15526 [19:09<4:29:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1032/15526 [19:09<4:29:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1033/15526 [19:10<4:29:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1033/15526 [19:10<4:29:02,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1034/15526 [19:11<4:29:02,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   7%| | 1034/15526 [19:11<4:29:02,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1035/15526 [19:12<4:28:55,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   7%| | 1035/15526 [19:12<4:28:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1036/15526 [19:13<4:28:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1036/15526 [19:13<4:28:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1037/15526 [19:13<4:28:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1037/15526 [19:13<4:28:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1038/15526 [19:14<4:28:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1038/15526 [19:14<4:28:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1039/15526 [19:15<4:28:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1039/15526 [19:15<4:28:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1040/15526 [19:15<4:28:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1040/15526 [19:15<4:28:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1041/15526 [19:16<4:28:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1041/15526 [19:16<4:28:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1042/15526 [19:17<4:28:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1042/15526 [19:17<4:28:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1043/15526 [19:17<4:27:58,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1043/15526 [19:17<4:27:58,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1044/15526 [19:18<4:27:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1044/15526 [19:18<4:27:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1045/15526 [19:19<4:27:52,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1045/15526 [19:19<4:27:52,  1.11s/it, v_num=73vx, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1046/15526 [19:20<4:27:44,  1.11s/it, v_num=73vx, train/loss=2.\r",
-      "Epoch 0:   7%| | 1046/15526 [19:20<4:27:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1047/15526 [19:21<4:27:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1047/15526 [19:21<4:27:44,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1048/15526 [19:22<4:27:45,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   7%| | 1048/15526 [19:22<4:27:45,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1049/15526 [19:23<4:27:37,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   7%| | 1049/15526 [19:23<4:27:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1050/15526 [19:24<4:27:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1050/15526 [19:24<4:27:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1051/15526 [19:25<4:27:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1051/15526 [19:25<4:27:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1052/15526 [19:26<4:27:23,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1052/15526 [19:26<4:27:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1053/15526 [19:26<4:27:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1053/15526 [19:26<4:27:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1054/15526 [19:27<4:27:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1054/15526 [19:27<4:27:16,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1055/15526 [19:28<4:27:10,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   7%| | 1055/15526 [19:28<4:27:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1056/15526 [19:39<4:29:16,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1056/15526 [19:39<4:29:16,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1057/15526 [19:39<4:29:08,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1057/15526 [19:39<4:29:08,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1058/15526 [19:40<4:29:09,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1058/15526 [19:40<4:29:09,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1059/15526 [19:41<4:29:02,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1059/15526 [19:41<4:29:02,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1060/15526 [19:42<4:28:55,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1060/15526 [19:42<4:28:55,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1061/15526 [19:42<4:28:48,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1061/15526 [19:42<4:28:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1062/15526 [19:43<4:28:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1062/15526 [19:43<4:28:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1063/15526 [19:44<4:28:34,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1063/15526 [19:44<4:28:34,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1064/15526 [19:45<4:28:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1064/15526 [19:45<4:28:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1065/15526 [19:45<4:28:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1065/15526 [19:45<4:28:20,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1066/15526 [19:46<4:28:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1066/15526 [19:46<4:28:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1067/15526 [19:47<4:28:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1067/15526 [19:47<4:28:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1068/15526 [19:47<4:27:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1068/15526 [19:47<4:27:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1069/15526 [19:49<4:28:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1069/15526 [19:49<4:28:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1070/15526 [19:49<4:27:53,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1070/15526 [19:49<4:27:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1071/15526 [19:50<4:27:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1071/15526 [19:50<4:27:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1072/15526 [19:51<4:27:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1072/15526 [19:51<4:27:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1073/15526 [19:52<4:27:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1073/15526 [19:52<4:27:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1074/15526 [19:53<4:27:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1074/15526 [19:53<4:27:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1075/15526 [19:53<4:27:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1075/15526 [19:53<4:27:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1076/15526 [19:54<4:27:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1076/15526 [19:54<4:27:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1077/15526 [19:55<4:27:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1077/15526 [19:55<4:27:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1078/15526 [19:56<4:27:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1078/15526 [19:56<4:27:20,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1079/15526 [19:57<4:27:13,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   7%| | 1079/15526 [19:57<4:27:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1080/15526 [19:58<4:27:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1080/15526 [19:58<4:27:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1081/15526 [19:58<4:26:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1081/15526 [19:58<4:26:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1082/15526 [20:00<4:27:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1082/15526 [20:00<4:27:00,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1083/15526 [20:00<4:26:53,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   7%| | 1083/15526 [20:00<4:26:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1084/15526 [20:01<4:26:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1084/15526 [20:01<4:26:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1085/15526 [20:02<4:26:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1085/15526 [20:02<4:26:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1086/15526 [20:03<4:26:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1086/15526 [20:03<4:26:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1087/15526 [20:04<4:26:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1087/15526 [20:04<4:26:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1088/15526 [20:14<4:28:41,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1088/15526 [20:14<4:28:41,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1089/15526 [20:15<4:28:34,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1089/15526 [20:15<4:28:34,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1090/15526 [20:16<4:28:27,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1090/15526 [20:16<4:28:27,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1091/15526 [20:16<4:28:20,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1091/15526 [20:16<4:28:20,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1092/15526 [20:17<4:28:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1092/15526 [20:17<4:28:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1093/15526 [20:18<4:28:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1093/15526 [20:18<4:28:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1094/15526 [20:19<4:28:07,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1094/15526 [20:19<4:28:07,  1.11s/it, v_num=73vx, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1095/15526 [20:20<4:28:07,  1.11s/it, v_num=73vx, train/loss=2.\r",
-      "Epoch 0:   7%| | 1095/15526 [20:20<4:28:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1096/15526 [20:21<4:28:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1096/15526 [20:21<4:28:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1097/15526 [20:22<4:27:53,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1097/15526 [20:22<4:27:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1098/15526 [20:22<4:27:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1098/15526 [20:22<4:27:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1099/15526 [20:23<4:27:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1099/15526 [20:23<4:27:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1100/15526 [20:24<4:27:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1100/15526 [20:24<4:27:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1101/15526 [20:25<4:27:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1101/15526 [20:25<4:27:32,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1102/15526 [20:25<4:27:25,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   7%| | 1102/15526 [20:25<4:27:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1103/15526 [20:26<4:27:18,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1103/15526 [20:26<4:27:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1104/15526 [20:27<4:27:18,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1104/15526 [20:27<4:27:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1105/15526 [20:28<4:27:17,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1105/15526 [20:28<4:27:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1106/15526 [20:30<4:27:17,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1106/15526 [20:30<4:27:17,  1.11s/it, v_num=73vx, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1107/15526 [20:31<4:27:17,  1.11s/it, v_num=73vx, train/loss=2.\r",
-      "Epoch 0:   7%| | 1107/15526 [20:31<4:27:17,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1108/15526 [20:32<4:27:17,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   7%| | 1108/15526 [20:32<4:27:17,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1109/15526 [20:33<4:27:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1109/15526 [20:33<4:27:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1110/15526 [20:33<4:27:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1110/15526 [20:33<4:27:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1111/15526 [20:34<4:26:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1111/15526 [20:34<4:26:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1112/15526 [20:35<4:26:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1112/15526 [20:35<4:26:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1113/15526 [20:36<4:26:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1113/15526 [20:36<4:26:55,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1114/15526 [20:37<4:26:55,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   7%| | 1114/15526 [20:37<4:26:55,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1115/15526 [20:38<4:26:48,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   7%| | 1115/15526 [20:38<4:26:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1116/15526 [20:39<4:26:48,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1116/15526 [20:39<4:26:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1117/15526 [20:40<4:26:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1117/15526 [20:40<4:26:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1118/15526 [20:41<4:26:34,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1118/15526 [20:41<4:26:34,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1119/15526 [20:41<4:26:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1119/15526 [20:41<4:26:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1120/15526 [20:49<4:27:57,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1120/15526 [20:49<4:27:57,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1121/15526 [20:50<4:27:50,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1121/15526 [20:50<4:27:50,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1122/15526 [20:51<4:27:43,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1122/15526 [20:51<4:27:43,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1123/15526 [20:51<4:27:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1123/15526 [20:51<4:27:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1124/15526 [20:52<4:27:29,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1124/15526 [20:52<4:27:29,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1125/15526 [20:53<4:27:23,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1125/15526 [20:53<4:27:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1126/15526 [20:53<4:27:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1126/15526 [20:53<4:27:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1127/15526 [20:54<4:27:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1127/15526 [20:54<4:27:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1128/15526 [20:55<4:27:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1128/15526 [20:55<4:27:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1129/15526 [20:55<4:26:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1129/15526 [20:55<4:26:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1130/15526 [20:56<4:26:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1130/15526 [20:56<4:26:49,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1131/15526 [20:57<4:26:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1131/15526 [20:57<4:26:42,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1132/15526 [20:58<4:26:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1132/15526 [20:58<4:26:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1133/15526 [20:58<4:26:29,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1133/15526 [20:58<4:26:29,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1134/15526 [20:59<4:26:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1134/15526 [20:59<4:26:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1135/15526 [21:00<4:26:23,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1135/15526 [21:00<4:26:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1136/15526 [21:01<4:26:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1136/15526 [21:01<4:26:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1137/15526 [21:01<4:26:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1137/15526 [21:01<4:26:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1138/15526 [21:03<4:26:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1138/15526 [21:03<4:26:10,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1139/15526 [21:03<4:26:03,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   7%| | 1139/15526 [21:03<4:26:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1140/15526 [21:04<4:25:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1140/15526 [21:04<4:25:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1141/15526 [21:05<4:25:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1141/15526 [21:05<4:25:57,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1142/15526 [21:06<4:25:50,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   7%| | 1142/15526 [21:06<4:25:50,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1143/15526 [21:07<4:25:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1143/15526 [21:07<4:25:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1144/15526 [21:07<4:25:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1144/15526 [21:07<4:25:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1145/15526 [21:08<4:25:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1145/15526 [21:08<4:25:37,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1146/15526 [21:10<4:25:37,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   7%| | 1146/15526 [21:10<4:25:37,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1147/15526 [21:10<4:25:30,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   7%| | 1147/15526 [21:10<4:25:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1148/15526 [21:11<4:25:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1148/15526 [21:11<4:25:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1149/15526 [21:12<4:25:17,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1149/15526 [21:12<4:25:17,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1150/15526 [21:12<4:25:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1150/15526 [21:12<4:25:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1151/15526 [21:13<4:25:04,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1151/15526 [21:13<4:25:04,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1152/15526 [21:25<4:27:15,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1152/15526 [21:25<4:27:15,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1153/15526 [21:25<4:27:08,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1153/15526 [21:25<4:27:08,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1154/15526 [21:26<4:27:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1154/15526 [21:26<4:27:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1155/15526 [21:27<4:26:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1155/15526 [21:27<4:26:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1156/15526 [21:27<4:26:48,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1156/15526 [21:27<4:26:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1157/15526 [21:28<4:26:48,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1157/15526 [21:28<4:26:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1158/15526 [21:29<4:26:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1158/15526 [21:29<4:26:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1159/15526 [21:30<4:26:34,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1159/15526 [21:30<4:26:34,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1160/15526 [21:31<4:26:28,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1160/15526 [21:31<4:26:28,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1161/15526 [21:31<4:26:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1161/15526 [21:31<4:26:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1162/15526 [21:32<4:26:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1162/15526 [21:32<4:26:22,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1163/15526 [21:33<4:26:16,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   7%| | 1163/15526 [21:33<4:26:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 1164/15526 [21:34<4:26:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   7%| | 1164/15526 [21:34<4:26:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1165/15526 [21:35<4:26:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1165/15526 [21:35<4:26:10,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1166/15526 [21:36<4:26:03,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1166/15526 [21:36<4:26:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1167/15526 [21:37<4:26:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1167/15526 [21:37<4:26:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1168/15526 [21:38<4:25:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1168/15526 [21:38<4:25:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1169/15526 [21:38<4:25:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1169/15526 [21:38<4:25:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1170/15526 [21:39<4:25:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1170/15526 [21:39<4:25:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1171/15526 [21:40<4:25:38,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1171/15526 [21:40<4:25:38,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1172/15526 [21:40<4:25:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1172/15526 [21:40<4:25:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1173/15526 [21:41<4:25:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1173/15526 [21:41<4:25:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1174/15526 [21:42<4:25:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1174/15526 [21:42<4:25:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1175/15526 [21:43<4:25:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1175/15526 [21:43<4:25:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1176/15526 [21:44<4:25:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1176/15526 [21:44<4:25:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1177/15526 [21:44<4:25:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1177/15526 [21:44<4:25:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1178/15526 [21:45<4:25:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1178/15526 [21:45<4:25:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1179/15526 [21:46<4:24:54,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1179/15526 [21:46<4:24:54,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1180/15526 [21:47<4:24:54,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1180/15526 [21:47<4:24:54,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1181/15526 [21:48<4:24:47,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1181/15526 [21:48<4:24:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1182/15526 [21:48<4:24:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1182/15526 [21:48<4:24:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1183/15526 [21:49<4:24:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1183/15526 [21:49<4:24:42,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1184/15526 [21:58<4:26:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1184/15526 [21:58<4:26:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1185/15526 [22:00<4:26:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1185/15526 [22:00<4:26:16,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1186/15526 [22:00<4:26:10,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1186/15526 [22:00<4:26:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1187/15526 [22:01<4:26:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1187/15526 [22:01<4:26:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1188/15526 [22:02<4:25:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1188/15526 [22:02<4:25:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1189/15526 [22:02<4:25:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1189/15526 [22:02<4:25:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1190/15526 [22:03<4:25:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1190/15526 [22:03<4:25:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1191/15526 [22:04<4:25:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1191/15526 [22:04<4:25:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1192/15526 [22:05<4:25:38,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1192/15526 [22:05<4:25:38,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1193/15526 [22:06<4:25:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1193/15526 [22:06<4:25:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1194/15526 [22:07<4:25:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1194/15526 [22:07<4:25:32,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1195/15526 [22:07<4:25:25,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1195/15526 [22:07<4:25:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1196/15526 [22:08<4:25:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1196/15526 [22:08<4:25:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1197/15526 [22:09<4:25:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1197/15526 [22:09<4:25:19,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1198/15526 [22:11<4:25:20,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1198/15526 [22:11<4:25:20,  1.11s/it, v_num=73vx, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1199/15526 [22:12<4:25:20,  1.11s/it, v_num=73vx, train/loss=2.\r",
-      "Epoch 0:   8%| | 1199/15526 [22:12<4:25:20,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1200/15526 [22:13<4:25:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1200/15526 [22:13<4:25:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1201/15526 [22:13<4:25:07,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1201/15526 [22:13<4:25:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1202/15526 [22:14<4:25:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1202/15526 [22:14<4:25:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1203/15526 [22:15<4:24:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1203/15526 [22:15<4:24:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1204/15526 [22:15<4:24:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1204/15526 [22:15<4:24:49,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1205/15526 [22:16<4:24:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1205/15526 [22:16<4:24:42,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1206/15526 [22:17<4:24:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1206/15526 [22:17<4:24:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1207/15526 [22:18<4:24:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1207/15526 [22:18<4:24:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1208/15526 [22:19<4:24:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1208/15526 [22:19<4:24:36,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1209/15526 [22:20<4:24:30,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1209/15526 [22:20<4:24:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1210/15526 [22:20<4:24:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1210/15526 [22:20<4:24:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1211/15526 [22:21<4:24:17,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1211/15526 [22:21<4:24:17,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1212/15526 [22:22<4:24:17,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1212/15526 [22:22<4:24:17,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1213/15526 [22:23<4:24:11,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1213/15526 [22:23<4:24:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1214/15526 [22:24<4:24:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1214/15526 [22:24<4:24:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1215/15526 [22:24<4:23:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1215/15526 [22:24<4:23:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1216/15526 [22:33<4:25:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1216/15526 [22:33<4:25:24,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1217/15526 [22:33<4:25:18,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1217/15526 [22:33<4:25:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1218/15526 [22:34<4:25:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1218/15526 [22:34<4:25:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1219/15526 [22:35<4:25:11,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1219/15526 [22:35<4:25:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1220/15526 [22:36<4:25:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1220/15526 [22:36<4:25:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1221/15526 [22:37<4:24:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1221/15526 [22:37<4:24:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1222/15526 [22:37<4:24:52,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1222/15526 [22:37<4:24:52,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1223/15526 [22:38<4:24:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1223/15526 [22:38<4:24:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1224/15526 [22:39<4:24:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1224/15526 [22:39<4:24:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1225/15526 [22:40<4:24:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1225/15526 [22:40<4:24:46,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1226/15526 [22:41<4:24:39,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1226/15526 [22:41<4:24:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1227/15526 [22:42<4:24:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1227/15526 [22:42<4:24:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1228/15526 [22:42<4:24:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1228/15526 [22:42<4:24:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1229/15526 [22:44<4:24:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1229/15526 [22:44<4:24:27,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1230/15526 [22:44<4:24:21,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1230/15526 [22:44<4:24:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1231/15526 [22:45<4:24:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1231/15526 [22:45<4:24:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1232/15526 [22:45<4:24:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1232/15526 [22:45<4:24:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1233/15526 [22:46<4:24:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1233/15526 [22:46<4:24:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1234/15526 [22:47<4:23:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1234/15526 [22:47<4:23:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1235/15526 [22:48<4:23:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1235/15526 [22:48<4:23:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1236/15526 [22:49<4:23:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1236/15526 [22:49<4:23:50,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1237/15526 [22:50<4:23:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1237/15526 [22:50<4:23:50,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1238/15526 [22:51<4:23:43,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1238/15526 [22:51<4:23:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1239/15526 [22:51<4:23:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1239/15526 [22:51<4:23:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1240/15526 [22:52<4:23:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1240/15526 [22:52<4:23:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1241/15526 [22:53<4:23:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1241/15526 [22:53<4:23:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1242/15526 [22:54<4:23:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1242/15526 [22:54<4:23:31,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1243/15526 [22:55<4:23:30,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1243/15526 [22:55<4:23:30,  1.11s/it, v_num=73vx, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1244/15526 [22:56<4:23:24,  1.11s/it, v_num=73vx, train/loss=2.\r",
-      "Epoch 0:   8%| | 1244/15526 [22:56<4:23:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1245/15526 [22:57<4:23:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1245/15526 [22:57<4:23:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1246/15526 [22:59<4:23:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1246/15526 [22:59<4:23:24,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1247/15526 [23:00<4:23:24,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1247/15526 [23:00<4:23:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1248/15526 [23:07<4:24:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1248/15526 [23:07<4:24:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1249/15526 [23:07<4:24:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1249/15526 [23:07<4:24:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1250/15526 [23:08<4:24:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1250/15526 [23:08<4:24:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1251/15526 [23:09<4:24:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1251/15526 [23:09<4:24:19,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1252/15526 [23:11<4:24:19,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1252/15526 [23:11<4:24:19,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1253/15526 [23:12<4:24:18,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1253/15526 [23:12<4:24:18,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1254/15526 [23:13<4:24:19,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1254/15526 [23:13<4:24:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1255/15526 [23:14<4:24:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1255/15526 [23:14<4:24:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1256/15526 [23:14<4:24:07,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1256/15526 [23:14<4:24:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1257/15526 [23:15<4:24:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1257/15526 [23:15<4:24:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1258/15526 [23:16<4:23:54,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1258/15526 [23:16<4:23:54,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1259/15526 [23:16<4:23:48,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1259/15526 [23:16<4:23:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1260/15526 [23:18<4:23:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1260/15526 [23:18<4:23:49,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1261/15526 [23:19<4:23:48,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1261/15526 [23:19<4:23:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1262/15526 [23:19<4:23:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1262/15526 [23:19<4:23:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1263/15526 [23:20<4:23:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1263/15526 [23:20<4:23:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1264/15526 [23:21<4:23:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1264/15526 [23:21<4:23:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1265/15526 [23:21<4:23:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1265/15526 [23:21<4:23:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1266/15526 [23:22<4:23:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1266/15526 [23:22<4:23:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1267/15526 [23:23<4:23:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1267/15526 [23:23<4:23:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1268/15526 [23:24<4:23:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1268/15526 [23:24<4:23:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1269/15526 [23:25<4:23:07,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1269/15526 [23:25<4:23:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1270/15526 [23:25<4:23:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1270/15526 [23:25<4:23:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1271/15526 [23:26<4:22:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1271/15526 [23:26<4:22:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1272/15526 [23:27<4:22:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1272/15526 [23:27<4:22:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1273/15526 [23:28<4:22:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1273/15526 [23:28<4:22:49,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1274/15526 [23:29<4:22:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1274/15526 [23:29<4:22:49,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1275/15526 [23:30<4:22:49,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1275/15526 [23:30<4:22:49,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1276/15526 [23:32<4:22:49,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1276/15526 [23:32<4:22:49,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1277/15526 [23:32<4:22:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1277/15526 [23:32<4:22:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1278/15526 [23:33<4:22:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1278/15526 [23:33<4:22:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1279/15526 [23:34<4:22:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1279/15526 [23:34<4:22:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1280/15526 [23:41<4:23:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1280/15526 [23:41<4:23:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1281/15526 [23:41<4:23:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1281/15526 [23:41<4:23:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1282/15526 [23:42<4:23:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1282/15526 [23:42<4:23:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1283/15526 [23:43<4:23:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1283/15526 [23:43<4:23:20,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1284/15526 [23:43<4:23:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1284/15526 [23:43<4:23:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1285/15526 [23:44<4:23:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1285/15526 [23:44<4:23:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1286/15526 [23:45<4:23:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1286/15526 [23:45<4:23:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1287/15526 [23:45<4:22:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1287/15526 [23:45<4:22:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1288/15526 [23:47<4:22:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1288/15526 [23:47<4:22:56,  1.11s/it, v_num=73vx, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1289/15526 [23:47<4:22:51,  1.11s/it, v_num=73vx, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1289/15526 [23:47<4:22:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1290/15526 [23:48<4:22:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1290/15526 [23:48<4:22:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1291/15526 [23:49<4:22:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1291/15526 [23:49<4:22:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1292/15526 [23:50<4:22:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1292/15526 [23:50<4:22:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1293/15526 [23:51<4:22:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1293/15526 [23:51<4:22:39,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1294/15526 [23:52<4:22:33,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1294/15526 [23:52<4:22:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1295/15526 [23:52<4:22:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1295/15526 [23:52<4:22:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1296/15526 [23:53<4:22:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1296/15526 [23:53<4:22:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1297/15526 [23:54<4:22:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1297/15526 [23:54<4:22:21,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1298/15526 [23:56<4:22:21,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1298/15526 [23:56<4:22:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1299/15526 [23:57<4:22:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1299/15526 [23:57<4:22:21,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1300/15526 [23:58<4:22:21,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1300/15526 [23:58<4:22:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1301/15526 [23:59<4:22:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1301/15526 [23:59<4:22:21,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1302/15526 [24:00<4:22:15,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1302/15526 [24:00<4:22:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1303/15526 [24:01<4:22:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1303/15526 [24:01<4:22:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1304/15526 [24:02<4:22:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1304/15526 [24:02<4:22:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1305/15526 [24:02<4:22:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1305/15526 [24:02<4:22:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1306/15526 [24:03<4:21:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1306/15526 [24:03<4:21:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1307/15526 [24:04<4:21:51,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1307/15526 [24:04<4:21:51,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1308/15526 [24:04<4:21:45,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1308/15526 [24:04<4:21:45,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1309/15526 [24:06<4:21:45,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1309/15526 [24:06<4:21:45,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1310/15526 [24:06<4:21:39,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1310/15526 [24:06<4:21:39,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1311/15526 [24:07<4:21:34,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1311/15526 [24:07<4:21:34,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1312/15526 [24:13<4:22:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1312/15526 [24:13<4:22:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1313/15526 [24:15<4:22:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1313/15526 [24:15<4:22:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1314/15526 [24:16<4:22:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1314/15526 [24:16<4:22:31,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1315/15526 [24:17<4:22:26,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1315/15526 [24:17<4:22:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1316/15526 [24:17<4:22:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1316/15526 [24:17<4:22:20,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1317/15526 [24:18<4:22:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   8%| | 1317/15526 [24:18<4:22:20,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1318/15526 [24:20<4:22:20,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1318/15526 [24:20<4:22:20,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 1319/15526 [24:21<4:22:20,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   8%| | 1319/15526 [24:21<4:22:20,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1320/15526 [24:22<4:22:14,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1320/15526 [24:22<4:22:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1321/15526 [24:23<4:22:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1321/15526 [24:23<4:22:14,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1322/15526 [24:24<4:22:14,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1322/15526 [24:24<4:22:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1323/15526 [24:25<4:22:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1323/15526 [24:25<4:22:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1324/15526 [24:26<4:22:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1324/15526 [24:26<4:22:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1325/15526 [24:27<4:22:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1325/15526 [24:27<4:22:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1326/15526 [24:28<4:22:04,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1326/15526 [24:28<4:22:04,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1327/15526 [24:28<4:21:58,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1327/15526 [24:28<4:21:58,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1328/15526 [24:29<4:21:52,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1328/15526 [24:29<4:21:52,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1329/15526 [24:30<4:21:52,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1329/15526 [24:30<4:21:52,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1330/15526 [24:32<4:21:52,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1330/15526 [24:32<4:21:52,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1331/15526 [24:32<4:21:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1331/15526 [24:32<4:21:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1332/15526 [24:33<4:21:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1332/15526 [24:33<4:21:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1333/15526 [24:34<4:21:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1333/15526 [24:34<4:21:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1334/15526 [24:34<4:21:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1334/15526 [24:34<4:21:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1335/15526 [24:35<4:21:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1335/15526 [24:35<4:21:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1336/15526 [24:36<4:21:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1336/15526 [24:36<4:21:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1337/15526 [24:37<4:21:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1337/15526 [24:37<4:21:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1338/15526 [24:38<4:21:13,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1338/15526 [24:38<4:21:13,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1339/15526 [24:38<4:21:07,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1339/15526 [24:38<4:21:07,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1340/15526 [24:39<4:21:02,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1340/15526 [24:39<4:21:02,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1341/15526 [24:40<4:20:56,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1341/15526 [24:40<4:20:56,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1342/15526 [24:40<4:20:51,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1342/15526 [24:40<4:20:51,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1343/15526 [24:42<4:20:51,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1343/15526 [24:42<4:20:51,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1344/15526 [24:48<4:21:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1344/15526 [24:48<4:21:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1345/15526 [24:49<4:21:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1345/15526 [24:49<4:21:46,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1346/15526 [24:50<4:21:41,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1346/15526 [24:50<4:21:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1347/15526 [24:51<4:21:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1347/15526 [24:51<4:21:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1348/15526 [24:51<4:21:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1348/15526 [24:51<4:21:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1349/15526 [24:52<4:21:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1349/15526 [24:52<4:21:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1350/15526 [24:53<4:21:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1350/15526 [24:53<4:21:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1351/15526 [24:54<4:21:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1351/15526 [24:54<4:21:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1352/15526 [24:55<4:21:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1352/15526 [24:55<4:21:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1353/15526 [24:55<4:21:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1353/15526 [24:55<4:21:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1354/15526 [24:56<4:21:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1354/15526 [24:56<4:21:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1355/15526 [24:57<4:21:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1355/15526 [24:57<4:21:03,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1356/15526 [24:58<4:20:58,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1356/15526 [24:58<4:20:58,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1357/15526 [24:59<4:20:52,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1357/15526 [24:59<4:20:52,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1358/15526 [24:59<4:20:47,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1358/15526 [24:59<4:20:47,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1359/15526 [25:01<4:20:47,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1359/15526 [25:01<4:20:47,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1360/15526 [25:01<4:20:41,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1360/15526 [25:01<4:20:41,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1361/15526 [25:02<4:20:36,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1361/15526 [25:02<4:20:36,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1362/15526 [25:03<4:20:31,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1362/15526 [25:03<4:20:31,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1363/15526 [25:04<4:20:31,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1363/15526 [25:04<4:20:31,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1364/15526 [25:05<4:20:31,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1364/15526 [25:05<4:20:31,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1365/15526 [25:06<4:20:26,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1365/15526 [25:06<4:20:26,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1366/15526 [25:06<4:20:20,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1366/15526 [25:06<4:20:20,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1367/15526 [25:07<4:20:15,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1367/15526 [25:07<4:20:15,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1368/15526 [25:08<4:20:15,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1368/15526 [25:08<4:20:15,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1369/15526 [25:09<4:20:09,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1369/15526 [25:09<4:20:09,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1370/15526 [25:10<4:20:09,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1370/15526 [25:10<4:20:09,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1371/15526 [25:11<4:20:04,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1371/15526 [25:11<4:20:04,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1372/15526 [25:12<4:20:04,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1372/15526 [25:12<4:20:04,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1373/15526 [25:13<4:19:59,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1373/15526 [25:13<4:19:59,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1374/15526 [25:14<4:19:59,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1374/15526 [25:14<4:19:59,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1375/15526 [25:15<4:19:53,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1375/15526 [25:15<4:19:53,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1376/15526 [25:23<4:21:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1376/15526 [25:23<4:21:10,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1377/15526 [25:24<4:21:04,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1377/15526 [25:24<4:21:04,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1378/15526 [25:25<4:21:04,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1378/15526 [25:25<4:21:04,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1379/15526 [25:26<4:20:58,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1379/15526 [25:26<4:20:58,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1380/15526 [25:27<4:20:58,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1380/15526 [25:27<4:20:58,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1381/15526 [25:28<4:20:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1381/15526 [25:28<4:20:57,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1382/15526 [25:29<4:20:52,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1382/15526 [25:29<4:20:52,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1383/15526 [25:30<4:20:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1383/15526 [25:30<4:20:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1384/15526 [25:31<4:20:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1384/15526 [25:31<4:20:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1385/15526 [25:31<4:20:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1385/15526 [25:31<4:20:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1386/15526 [25:33<4:20:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1386/15526 [25:33<4:20:41,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1387/15526 [25:33<4:20:35,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1387/15526 [25:33<4:20:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1388/15526 [25:34<4:20:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1388/15526 [25:34<4:20:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1389/15526 [25:35<4:20:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1389/15526 [25:35<4:20:30,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1390/15526 [25:37<4:20:30,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1390/15526 [25:37<4:20:30,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1391/15526 [25:37<4:20:25,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1391/15526 [25:37<4:20:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1392/15526 [25:38<4:20:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1392/15526 [25:38<4:20:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1393/15526 [25:40<4:20:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1393/15526 [25:40<4:20:26,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1394/15526 [25:41<4:20:26,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1394/15526 [25:41<4:20:26,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1395/15526 [25:42<4:20:26,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1395/15526 [25:42<4:20:26,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1396/15526 [25:43<4:20:26,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1396/15526 [25:43<4:20:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1397/15526 [25:44<4:20:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1397/15526 [25:44<4:20:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1398/15526 [25:45<4:20:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1398/15526 [25:45<4:20:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1399/15526 [25:46<4:20:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1399/15526 [25:46<4:20:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1400/15526 [25:47<4:20:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1400/15526 [25:47<4:20:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1401/15526 [25:48<4:20:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1401/15526 [25:48<4:20:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1402/15526 [25:49<4:20:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1402/15526 [25:49<4:20:09,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1403/15526 [25:50<4:20:04,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1403/15526 [25:50<4:20:04,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1404/15526 [25:51<4:20:04,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1404/15526 [25:51<4:20:04,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1405/15526 [25:52<4:20:04,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1405/15526 [25:52<4:20:04,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1406/15526 [25:53<4:19:59,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1406/15526 [25:53<4:19:59,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1407/15526 [25:53<4:19:53,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1407/15526 [25:53<4:19:53,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1408/15526 [25:59<4:20:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1408/15526 [25:59<4:20:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1409/15526 [26:01<4:20:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1409/15526 [26:01<4:20:40,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1410/15526 [26:02<4:20:40,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1410/15526 [26:02<4:20:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1411/15526 [26:03<4:20:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1411/15526 [26:03<4:20:40,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1412/15526 [26:04<4:20:40,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1412/15526 [26:04<4:20:40,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1413/15526 [26:05<4:20:35,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1413/15526 [26:05<4:20:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1414/15526 [26:06<4:20:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1414/15526 [26:06<4:20:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1415/15526 [26:06<4:20:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1415/15526 [26:06<4:20:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1416/15526 [26:07<4:20:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1416/15526 [26:07<4:20:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1417/15526 [26:08<4:20:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1417/15526 [26:08<4:20:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1418/15526 [26:09<4:20:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1418/15526 [26:09<4:20:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1419/15526 [26:10<4:20:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1419/15526 [26:10<4:20:13,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1420/15526 [26:11<4:20:13,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1420/15526 [26:11<4:20:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1421/15526 [26:12<4:20:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1421/15526 [26:12<4:20:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1422/15526 [26:13<4:20:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1422/15526 [26:13<4:20:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1423/15526 [26:14<4:20:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1423/15526 [26:14<4:20:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1424/15526 [26:14<4:19:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1424/15526 [26:14<4:19:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1425/15526 [26:16<4:19:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1425/15526 [26:16<4:19:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1426/15526 [26:16<4:19:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1426/15526 [26:16<4:19:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1427/15526 [26:17<4:19:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1427/15526 [26:17<4:19:50,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1428/15526 [26:18<4:19:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1428/15526 [26:18<4:19:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1429/15526 [26:19<4:19:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1429/15526 [26:19<4:19:44,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1430/15526 [26:20<4:19:39,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1430/15526 [26:20<4:19:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1431/15526 [26:21<4:19:33,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1431/15526 [26:21<4:19:33,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1432/15526 [26:22<4:19:33,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1432/15526 [26:22<4:19:33,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1433/15526 [26:23<4:19:28,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1433/15526 [26:23<4:19:28,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1434/15526 [26:23<4:19:22,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1434/15526 [26:23<4:19:22,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1435/15526 [26:24<4:19:17,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1435/15526 [26:24<4:19:17,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1436/15526 [26:25<4:19:12,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1436/15526 [26:25<4:19:12,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1437/15526 [26:25<4:19:06,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1437/15526 [26:25<4:19:06,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1438/15526 [26:26<4:19:06,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1438/15526 [26:26<4:19:06,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1439/15526 [26:27<4:19:00,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1439/15526 [26:27<4:19:00,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1440/15526 [26:33<4:19:52,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1440/15526 [26:33<4:19:52,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1441/15526 [26:34<4:19:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1441/15526 [26:34<4:19:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1442/15526 [26:35<4:19:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1442/15526 [26:35<4:19:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1443/15526 [26:36<4:19:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1443/15526 [26:36<4:19:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1444/15526 [26:37<4:19:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1444/15526 [26:37<4:19:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1445/15526 [26:37<4:19:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1445/15526 [26:37<4:19:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1446/15526 [26:38<4:19:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1446/15526 [26:38<4:19:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1447/15526 [26:39<4:19:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1447/15526 [26:39<4:19:20,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1448/15526 [26:39<4:19:14,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1448/15526 [26:39<4:19:14,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1449/15526 [26:40<4:19:09,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1449/15526 [26:40<4:19:09,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1450/15526 [26:41<4:19:03,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1450/15526 [26:41<4:19:03,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1451/15526 [26:41<4:18:58,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1451/15526 [26:41<4:18:58,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1452/15526 [26:43<4:18:58,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1452/15526 [26:43<4:18:58,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1453/15526 [26:44<4:18:57,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1453/15526 [26:44<4:18:57,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1454/15526 [26:44<4:18:52,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1454/15526 [26:44<4:18:52,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1455/15526 [26:46<4:18:51,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1455/15526 [26:46<4:18:51,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1456/15526 [26:47<4:18:51,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1456/15526 [26:47<4:18:51,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1457/15526 [26:47<4:18:46,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1457/15526 [26:47<4:18:46,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1458/15526 [26:48<4:18:40,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1458/15526 [26:48<4:18:40,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1459/15526 [26:49<4:18:35,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1459/15526 [26:49<4:18:35,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1460/15526 [26:49<4:18:30,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1460/15526 [26:49<4:18:30,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1461/15526 [26:50<4:18:25,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1461/15526 [26:50<4:18:25,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1462/15526 [26:51<4:18:20,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1462/15526 [26:51<4:18:20,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1463/15526 [26:51<4:18:14,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1463/15526 [26:51<4:18:14,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1464/15526 [26:52<4:18:09,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1464/15526 [26:52<4:18:09,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1465/15526 [26:53<4:18:04,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1465/15526 [26:53<4:18:04,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1466/15526 [26:54<4:18:04,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1466/15526 [26:54<4:18:04,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1467/15526 [26:55<4:17:59,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1467/15526 [26:55<4:17:59,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1468/15526 [26:55<4:17:54,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1468/15526 [26:55<4:17:54,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1469/15526 [26:57<4:17:54,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1469/15526 [26:57<4:17:54,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1470/15526 [26:57<4:17:49,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1470/15526 [26:57<4:17:49,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1471/15526 [26:59<4:17:49,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1471/15526 [26:59<4:17:49,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1472/15526 [27:08<4:19:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1472/15526 [27:08<4:19:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1473/15526 [27:09<4:19:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:   9%| | 1473/15526 [27:09<4:19:05,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 1474/15526 [27:10<4:19:00,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:   9%| | 1474/15526 [27:10<4:19:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1475/15526 [27:11<4:19:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1475/15526 [27:11<4:19:00,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1476/15526 [27:12<4:18:55,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1476/15526 [27:12<4:18:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1477/15526 [27:13<4:18:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1477/15526 [27:13<4:18:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1478/15526 [27:13<4:18:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1478/15526 [27:13<4:18:50,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1479/15526 [27:14<4:18:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1479/15526 [27:14<4:18:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1480/15526 [27:15<4:18:40,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1480/15526 [27:15<4:18:40,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1481/15526 [27:16<4:18:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1481/15526 [27:16<4:18:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1482/15526 [27:17<4:18:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1482/15526 [27:17<4:18:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1483/15526 [27:18<4:18:34,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1483/15526 [27:18<4:18:34,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1484/15526 [27:19<4:18:29,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1484/15526 [27:19<4:18:29,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1485/15526 [27:19<4:18:24,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1485/15526 [27:19<4:18:24,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1486/15526 [27:20<4:18:24,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1486/15526 [27:20<4:18:24,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1487/15526 [27:21<4:18:19,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1487/15526 [27:21<4:18:19,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1488/15526 [27:22<4:18:13,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1488/15526 [27:22<4:18:13,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1489/15526 [27:23<4:18:13,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1489/15526 [27:23<4:18:13,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1490/15526 [27:24<4:18:08,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1490/15526 [27:24<4:18:08,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1491/15526 [27:24<4:18:03,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1491/15526 [27:24<4:18:03,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1492/15526 [27:25<4:17:58,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1492/15526 [27:25<4:17:58,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1493/15526 [27:26<4:17:53,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1493/15526 [27:26<4:17:53,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1494/15526 [27:26<4:17:48,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1494/15526 [27:26<4:17:48,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1495/15526 [27:27<4:17:43,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1495/15526 [27:27<4:17:43,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1496/15526 [27:28<4:17:43,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1496/15526 [27:28<4:17:43,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1497/15526 [27:30<4:17:43,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1497/15526 [27:30<4:17:43,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1498/15526 [27:31<4:17:43,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1498/15526 [27:31<4:17:43,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1499/15526 [27:32<4:17:42,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1499/15526 [27:32<4:17:42,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1500/15526 [27:33<4:17:37,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1500/15526 [27:33<4:17:37,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1501/15526 [27:33<4:17:33,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1501/15526 [27:33<4:17:33,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1502/15526 [27:34<4:17:28,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1502/15526 [27:34<4:17:28,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1503/15526 [27:35<4:17:23,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1503/15526 [27:35<4:17:23,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1504/15526 [27:43<4:18:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1504/15526 [27:43<4:18:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1505/15526 [27:44<4:18:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1505/15526 [27:44<4:18:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1506/15526 [27:44<4:18:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1506/15526 [27:44<4:18:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1507/15526 [27:45<4:18:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1507/15526 [27:45<4:18:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1508/15526 [27:46<4:18:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1508/15526 [27:46<4:18:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1509/15526 [27:47<4:18:08,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1509/15526 [27:47<4:18:08,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1510/15526 [27:48<4:18:03,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1510/15526 [27:48<4:18:03,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1511/15526 [27:48<4:17:58,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1511/15526 [27:48<4:17:58,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1512/15526 [27:49<4:17:53,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1512/15526 [27:49<4:17:53,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1513/15526 [27:50<4:17:48,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1513/15526 [27:50<4:17:48,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1514/15526 [27:50<4:17:43,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1514/15526 [27:50<4:17:43,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1515/15526 [27:51<4:17:42,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1515/15526 [27:51<4:17:42,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1516/15526 [27:52<4:17:37,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1516/15526 [27:52<4:17:37,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1517/15526 [27:53<4:17:37,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1517/15526 [27:53<4:17:37,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1518/15526 [27:54<4:17:32,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1518/15526 [27:54<4:17:32,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1519/15526 [27:55<4:17:27,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1519/15526 [27:55<4:17:27,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1520/15526 [27:56<4:17:27,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1520/15526 [27:56<4:17:27,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1521/15526 [27:57<4:17:23,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1521/15526 [27:57<4:17:23,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1522/15526 [27:57<4:17:18,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1522/15526 [27:57<4:17:18,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1523/15526 [27:58<4:17:13,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1523/15526 [27:58<4:17:13,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1524/15526 [27:59<4:17:08,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1524/15526 [27:59<4:17:08,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1525/15526 [28:00<4:17:08,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1525/15526 [28:00<4:17:08,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1526/15526 [28:01<4:17:08,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1526/15526 [28:01<4:17:08,  1.10s/it, v_num=73vx, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1527/15526 [28:02<4:17:03,  1.10s/it, v_num=73vx, train/loss=2.\r",
-      "Epoch 0:  10%| | 1527/15526 [28:02<4:17:03,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1528/15526 [28:03<4:16:58,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1528/15526 [28:03<4:16:58,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1529/15526 [28:03<4:16:53,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1529/15526 [28:03<4:16:53,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1530/15526 [28:04<4:16:53,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1530/15526 [28:04<4:16:53,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1531/15526 [28:06<4:16:53,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1531/15526 [28:06<4:16:53,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1532/15526 [28:06<4:16:48,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1532/15526 [28:06<4:16:48,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1533/15526 [28:08<4:16:48,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1533/15526 [28:08<4:16:48,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1534/15526 [28:09<4:16:48,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1534/15526 [28:09<4:16:48,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1535/15526 [28:10<4:16:48,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1535/15526 [28:10<4:16:48,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1536/15526 [28:18<4:17:49,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1536/15526 [28:18<4:17:49,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1537/15526 [28:19<4:17:44,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1537/15526 [28:19<4:17:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1538/15526 [28:19<4:17:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1538/15526 [28:19<4:17:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1539/15526 [28:20<4:17:34,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1539/15526 [28:20<4:17:34,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1540/15526 [28:21<4:17:29,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1540/15526 [28:21<4:17:29,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1541/15526 [28:21<4:17:24,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1541/15526 [28:21<4:17:24,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1542/15526 [28:22<4:17:19,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1542/15526 [28:22<4:17:19,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1543/15526 [28:23<4:17:19,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1543/15526 [28:23<4:17:19,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1544/15526 [28:24<4:17:14,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1544/15526 [28:24<4:17:14,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1545/15526 [28:25<4:17:14,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1545/15526 [28:25<4:17:14,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1546/15526 [28:26<4:17:09,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1546/15526 [28:26<4:17:09,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1547/15526 [28:27<4:17:09,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1547/15526 [28:27<4:17:09,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1548/15526 [28:28<4:17:08,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1548/15526 [28:28<4:17:08,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1549/15526 [28:29<4:17:09,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1549/15526 [28:29<4:17:09,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1550/15526 [28:31<4:17:08,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1550/15526 [28:31<4:17:08,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1551/15526 [28:31<4:17:03,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1551/15526 [28:31<4:17:04,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1552/15526 [28:32<4:16:59,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1552/15526 [28:32<4:16:59,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1553/15526 [28:33<4:16:59,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1553/15526 [28:33<4:16:59,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1554/15526 [28:34<4:16:58,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1554/15526 [28:34<4:16:58,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1555/15526 [28:36<4:16:58,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1555/15526 [28:36<4:16:58,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1556/15526 [28:36<4:16:53,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1556/15526 [28:36<4:16:53,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1557/15526 [28:37<4:16:49,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1557/15526 [28:37<4:16:49,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1558/15526 [28:38<4:16:48,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1558/15526 [28:38<4:16:48,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1559/15526 [28:39<4:16:48,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1559/15526 [28:39<4:16:48,  1.10s/it, v_num=73vx, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1560/15526 [28:40<4:16:43,  1.10s/it, v_num=73vx, train/loss=2.\r",
-      "Epoch 0:  10%| | 1560/15526 [28:40<4:16:43,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1561/15526 [28:41<4:16:38,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1561/15526 [28:41<4:16:38,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1562/15526 [28:41<4:16:34,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1562/15526 [28:41<4:16:34,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1563/15526 [28:42<4:16:29,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1563/15526 [28:42<4:16:29,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1564/15526 [28:43<4:16:29,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1564/15526 [28:43<4:16:29,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1565/15526 [28:44<4:16:24,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1565/15526 [28:44<4:16:24,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1566/15526 [28:45<4:16:24,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1566/15526 [28:45<4:16:24,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1567/15526 [28:47<4:16:24,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1567/15526 [28:47<4:16:24,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1568/15526 [28:53<4:17:12,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1568/15526 [28:53<4:17:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1569/15526 [28:54<4:17:07,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1569/15526 [28:54<4:17:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1570/15526 [28:54<4:17:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1570/15526 [28:54<4:17:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1571/15526 [28:55<4:16:57,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1571/15526 [28:55<4:16:57,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1572/15526 [28:56<4:16:57,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1572/15526 [28:56<4:16:57,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1573/15526 [28:58<4:16:57,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1573/15526 [28:58<4:16:57,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1574/15526 [28:58<4:16:52,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1574/15526 [28:58<4:16:52,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1575/15526 [28:59<4:16:47,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1575/15526 [28:59<4:16:47,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1576/15526 [29:00<4:16:47,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1576/15526 [29:00<4:16:47,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1577/15526 [29:01<4:16:42,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1577/15526 [29:01<4:16:42,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1578/15526 [29:02<4:16:42,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1578/15526 [29:02<4:16:42,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1579/15526 [29:03<4:16:37,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1579/15526 [29:03<4:16:37,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1580/15526 [29:03<4:16:33,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1580/15526 [29:03<4:16:33,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1581/15526 [29:05<4:16:32,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1581/15526 [29:05<4:16:32,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1582/15526 [29:05<4:16:27,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1582/15526 [29:05<4:16:27,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1583/15526 [29:06<4:16:23,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1583/15526 [29:06<4:16:23,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1584/15526 [29:07<4:16:18,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1584/15526 [29:07<4:16:18,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1585/15526 [29:08<4:16:18,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1585/15526 [29:08<4:16:18,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1586/15526 [29:09<4:16:13,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1586/15526 [29:09<4:16:13,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1587/15526 [29:09<4:16:08,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1587/15526 [29:09<4:16:08,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1588/15526 [29:10<4:16:08,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1588/15526 [29:10<4:16:08,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1589/15526 [29:11<4:16:03,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1589/15526 [29:11<4:16:03,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1590/15526 [29:12<4:15:58,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1590/15526 [29:12<4:15:58,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1591/15526 [29:13<4:15:58,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1591/15526 [29:13<4:15:58,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1592/15526 [29:14<4:15:58,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1592/15526 [29:14<4:15:58,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1593/15526 [29:15<4:15:58,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1593/15526 [29:15<4:15:58,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1594/15526 [29:16<4:15:53,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1594/15526 [29:16<4:15:53,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1595/15526 [29:17<4:15:49,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1595/15526 [29:17<4:15:49,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1596/15526 [29:18<4:15:44,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1596/15526 [29:18<4:15:44,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1597/15526 [29:19<4:15:44,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1597/15526 [29:19<4:15:44,  1.10s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1598/15526 [29:19<4:15:39,  1.10s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1598/15526 [29:19<4:15:39,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1599/15526 [29:20<4:15:34,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1599/15526 [29:20<4:15:34,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1600/15526 [29:27<4:16:28,  1.10s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1600/15526 [29:27<4:16:28,  1.10s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1601/15526 [29:52<4:19:47,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1601/15526 [29:52<4:19:47,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1602/15526 [29:52<4:19:42,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1602/15526 [29:52<4:19:42,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1603/15526 [29:54<4:19:42,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1603/15526 [29:54<4:19:42,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1604/15526 [29:54<4:19:37,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1604/15526 [29:54<4:19:37,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1605/15526 [29:55<4:19:32,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1605/15526 [29:55<4:19:32,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1606/15526 [29:56<4:19:27,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1606/15526 [29:56<4:19:27,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1607/15526 [29:56<4:19:22,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1607/15526 [29:56<4:19:22,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1608/15526 [29:57<4:19:17,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1608/15526 [29:57<4:19:17,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1609/15526 [29:58<4:19:12,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1609/15526 [29:58<4:19:12,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1610/15526 [29:58<4:19:08,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1610/15526 [29:58<4:19:08,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1611/15526 [29:59<4:19:03,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1611/15526 [29:59<4:19:03,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1612/15526 [30:00<4:19:03,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1612/15526 [30:00<4:19:03,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1613/15526 [30:01<4:18:58,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1613/15526 [30:01<4:18:58,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1614/15526 [30:02<4:18:53,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1614/15526 [30:02<4:18:53,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1615/15526 [30:02<4:18:48,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1615/15526 [30:02<4:18:48,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1616/15526 [30:03<4:18:43,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1616/15526 [30:03<4:18:43,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1617/15526 [30:04<4:18:38,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1617/15526 [30:04<4:18:38,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1618/15526 [30:04<4:18:33,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1618/15526 [30:04<4:18:33,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1619/15526 [30:05<4:18:33,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1619/15526 [30:05<4:18:33,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1620/15526 [30:06<4:18:28,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1620/15526 [30:06<4:18:28,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1621/15526 [30:07<4:18:28,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1621/15526 [30:07<4:18:28,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1622/15526 [30:09<4:18:27,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1622/15526 [30:09<4:18:27,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1623/15526 [30:10<4:18:27,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1623/15526 [30:10<4:18:27,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1624/15526 [30:11<4:18:26,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1624/15526 [30:11<4:18:26,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1625/15526 [30:12<4:18:21,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1625/15526 [30:12<4:18:21,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1626/15526 [30:13<4:18:21,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1626/15526 [30:13<4:18:21,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1627/15526 [30:14<4:18:20,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1627/15526 [30:14<4:18:20,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1628/15526 [30:15<4:18:20,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1628/15526 [30:15<4:18:20,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1629/15526 [30:16<4:18:19,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  10%| | 1629/15526 [30:16<4:18:19,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1630/15526 [30:18<4:18:19,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  10%| | 1630/15526 [30:18<4:18:19,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1631/15526 [30:18<4:18:14,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1631/15526 [30:18<4:18:14,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1632/15526 [30:25<4:19:00,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1632/15526 [30:25<4:19:00,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1633/15526 [30:26<4:18:55,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1633/15526 [30:26<4:18:55,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1634/15526 [30:27<4:18:54,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1634/15526 [30:27<4:18:54,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1635/15526 [30:27<4:18:49,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1635/15526 [30:27<4:18:49,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1636/15526 [30:28<4:18:44,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1636/15526 [30:28<4:18:44,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1637/15526 [30:29<4:18:44,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1637/15526 [30:29<4:18:44,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1638/15526 [30:30<4:18:39,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1638/15526 [30:30<4:18:39,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1639/15526 [30:31<4:18:34,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1639/15526 [30:31<4:18:34,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1640/15526 [30:32<4:18:34,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1640/15526 [30:32<4:18:34,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1641/15526 [30:32<4:18:29,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1641/15526 [30:32<4:18:29,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1642/15526 [30:34<4:18:29,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1642/15526 [30:34<4:18:29,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1643/15526 [30:34<4:18:24,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1643/15526 [30:34<4:18:24,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1644/15526 [30:35<4:18:19,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1644/15526 [30:35<4:18:19,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1645/15526 [30:36<4:18:14,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1645/15526 [30:36<4:18:14,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1646/15526 [30:36<4:18:09,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1646/15526 [30:36<4:18:09,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1647/15526 [30:37<4:18:05,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1647/15526 [30:37<4:18:05,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1648/15526 [30:38<4:18:00,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1648/15526 [30:38<4:18:00,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1649/15526 [30:39<4:17:56,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1649/15526 [30:39<4:17:56,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1650/15526 [30:40<4:17:56,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1650/15526 [30:40<4:17:56,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1651/15526 [30:40<4:17:51,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1651/15526 [30:40<4:17:51,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1652/15526 [30:41<4:17:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1652/15526 [30:41<4:17:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1653/15526 [30:42<4:17:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1653/15526 [30:42<4:17:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1654/15526 [30:44<4:17:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1654/15526 [30:44<4:17:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1655/15526 [30:45<4:17:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1655/15526 [30:45<4:17:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1656/15526 [30:45<4:17:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1656/15526 [30:45<4:17:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1657/15526 [30:46<4:17:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1657/15526 [30:46<4:17:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1658/15526 [30:47<4:17:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1658/15526 [30:47<4:17:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1659/15526 [30:48<4:17:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1659/15526 [30:48<4:17:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1660/15526 [30:49<4:17:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1660/15526 [30:49<4:17:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1661/15526 [30:49<4:17:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1661/15526 [30:49<4:17:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1662/15526 [30:51<4:17:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1662/15526 [30:51<4:17:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1663/15526 [30:51<4:17:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1663/15526 [30:51<4:17:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1664/15526 [30:59<4:18:13,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1664/15526 [30:59<4:18:13,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1665/15526 [31:00<4:18:08,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1665/15526 [31:00<4:18:08,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1666/15526 [31:01<4:18:04,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1666/15526 [31:01<4:18:04,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1667/15526 [31:02<4:18:03,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1667/15526 [31:02<4:18:03,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1668/15526 [31:03<4:17:58,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1668/15526 [31:03<4:17:58,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1669/15526 [31:03<4:17:54,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1669/15526 [31:03<4:17:54,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1670/15526 [31:04<4:17:49,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1670/15526 [31:04<4:17:49,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1671/15526 [31:05<4:17:44,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1671/15526 [31:05<4:17:44,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1672/15526 [31:06<4:17:44,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1672/15526 [31:06<4:17:44,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1673/15526 [31:07<4:17:39,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1673/15526 [31:07<4:17:39,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1674/15526 [31:08<4:17:39,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1674/15526 [31:08<4:17:39,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1675/15526 [31:08<4:17:35,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1675/15526 [31:08<4:17:35,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1676/15526 [31:09<4:17:30,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1676/15526 [31:09<4:17:30,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1677/15526 [31:10<4:17:30,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1677/15526 [31:10<4:17:30,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1678/15526 [31:11<4:17:25,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1678/15526 [31:11<4:17:25,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1679/15526 [31:12<4:17:25,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1679/15526 [31:12<4:17:25,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1680/15526 [31:14<4:17:25,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1680/15526 [31:14<4:17:25,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1681/15526 [31:14<4:17:20,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1681/15526 [31:14<4:17:20,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1682/15526 [31:15<4:17:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1682/15526 [31:15<4:17:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1683/15526 [31:16<4:17:11,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1683/15526 [31:16<4:17:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1684/15526 [31:17<4:17:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1684/15526 [31:17<4:17:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1685/15526 [31:18<4:17:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1685/15526 [31:18<4:17:10,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1686/15526 [31:19<4:17:05,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1686/15526 [31:19<4:17:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1687/15526 [31:19<4:17:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1687/15526 [31:19<4:17:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1688/15526 [31:21<4:17:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1688/15526 [31:21<4:17:01,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1689/15526 [31:21<4:16:56,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1689/15526 [31:21<4:16:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1690/15526 [31:22<4:16:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1690/15526 [31:22<4:16:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1691/15526 [31:23<4:16:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1691/15526 [31:23<4:16:51,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1692/15526 [31:24<4:16:51,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1692/15526 [31:24<4:16:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1693/15526 [31:26<4:16:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1693/15526 [31:26<4:16:51,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1694/15526 [31:26<4:16:46,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1694/15526 [31:26<4:16:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1695/15526 [31:28<4:16:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1695/15526 [31:28<4:16:46,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1696/15526 [31:35<4:17:37,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1696/15526 [31:35<4:17:37,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1697/15526 [31:36<4:17:32,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1697/15526 [31:36<4:17:32,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1698/15526 [31:37<4:17:32,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1698/15526 [31:37<4:17:32,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1699/15526 [31:38<4:17:28,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1699/15526 [31:38<4:17:28,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1700/15526 [31:39<4:17:27,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1700/15526 [31:39<4:17:27,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1701/15526 [31:40<4:17:23,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1701/15526 [31:40<4:17:23,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1702/15526 [31:40<4:17:18,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1702/15526 [31:40<4:17:18,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1703/15526 [31:42<4:17:18,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1703/15526 [31:42<4:17:18,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1704/15526 [31:43<4:17:18,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1704/15526 [31:43<4:17:18,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1705/15526 [31:43<4:17:13,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1705/15526 [31:43<4:17:13,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1706/15526 [31:45<4:17:13,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1706/15526 [31:45<4:17:13,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1707/15526 [31:46<4:17:13,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1707/15526 [31:46<4:17:13,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1708/15526 [31:47<4:17:12,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1708/15526 [31:47<4:17:12,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1709/15526 [31:48<4:17:12,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1709/15526 [31:48<4:17:12,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1710/15526 [31:49<4:17:07,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1710/15526 [31:49<4:17:07,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1711/15526 [31:50<4:17:03,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1711/15526 [31:50<4:17:03,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1712/15526 [31:50<4:16:58,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1712/15526 [31:50<4:16:58,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1713/15526 [31:51<4:16:53,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1713/15526 [31:51<4:16:53,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1714/15526 [31:52<4:16:53,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1714/15526 [31:52<4:16:53,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1715/15526 [31:53<4:16:49,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1715/15526 [31:53<4:16:49,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1716/15526 [31:54<4:16:49,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1716/15526 [31:54<4:16:49,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1717/15526 [31:55<4:16:44,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1717/15526 [31:55<4:16:44,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1718/15526 [31:56<4:16:44,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1718/15526 [31:56<4:16:44,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1719/15526 [31:57<4:16:44,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1719/15526 [31:57<4:16:44,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1720/15526 [31:58<4:16:39,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1720/15526 [31:58<4:16:39,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1721/15526 [31:59<4:16:35,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1721/15526 [31:59<4:16:35,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1722/15526 [31:59<4:16:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1722/15526 [31:59<4:16:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1723/15526 [32:00<4:16:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1723/15526 [32:00<4:16:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1724/15526 [32:01<4:16:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1724/15526 [32:01<4:16:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1725/15526 [32:02<4:16:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1725/15526 [32:02<4:16:21,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1726/15526 [32:03<4:16:17,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1726/15526 [32:03<4:16:17,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1727/15526 [32:03<4:16:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1727/15526 [32:03<4:16:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1728/15526 [32:10<4:16:57,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1728/15526 [32:10<4:16:57,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1729/15526 [32:11<4:16:53,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1729/15526 [32:11<4:16:53,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1730/15526 [32:12<4:16:48,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1730/15526 [32:12<4:16:48,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1731/15526 [32:13<4:16:48,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1731/15526 [32:13<4:16:48,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1732/15526 [32:14<4:16:44,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1732/15526 [32:14<4:16:44,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1733/15526 [32:14<4:16:39,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1733/15526 [32:14<4:16:39,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1734/15526 [32:16<4:16:39,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1734/15526 [32:16<4:16:39,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1735/15526 [32:17<4:16:38,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1735/15526 [32:17<4:16:38,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1736/15526 [32:17<4:16:34,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1736/15526 [32:17<4:16:34,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1737/15526 [32:18<4:16:29,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1737/15526 [32:18<4:16:29,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1738/15526 [32:19<4:16:29,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1738/15526 [32:19<4:16:29,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1739/15526 [32:21<4:16:28,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1739/15526 [32:21<4:16:28,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1740/15526 [32:21<4:16:24,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1740/15526 [32:21<4:16:24,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1741/15526 [32:22<4:16:19,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1741/15526 [32:22<4:16:19,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1742/15526 [32:23<4:16:15,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1742/15526 [32:23<4:16:15,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1743/15526 [32:23<4:16:10,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1743/15526 [32:23<4:16:10,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1744/15526 [32:24<4:16:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1744/15526 [32:24<4:16:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1745/15526 [32:25<4:16:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1745/15526 [32:25<4:16:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1746/15526 [32:26<4:16:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1746/15526 [32:26<4:16:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1747/15526 [32:27<4:16:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1747/15526 [32:27<4:16:00,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1748/15526 [32:28<4:15:56,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1748/15526 [32:28<4:15:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1749/15526 [32:29<4:15:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1749/15526 [32:29<4:15:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1750/15526 [32:30<4:15:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1750/15526 [32:30<4:15:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1751/15526 [32:31<4:15:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1751/15526 [32:31<4:15:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1752/15526 [32:32<4:15:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1752/15526 [32:32<4:15:50,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1753/15526 [32:33<4:15:50,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1753/15526 [32:33<4:15:50,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1754/15526 [32:34<4:15:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1754/15526 [32:34<4:15:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1755/15526 [32:35<4:15:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1755/15526 [32:35<4:15:45,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1756/15526 [32:36<4:15:44,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1756/15526 [32:36<4:15:44,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1757/15526 [32:38<4:15:44,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1757/15526 [32:38<4:15:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1758/15526 [32:38<4:15:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1758/15526 [32:38<4:15:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1759/15526 [32:39<4:15:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1759/15526 [32:39<4:15:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1760/15526 [32:46<4:16:24,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1760/15526 [32:46<4:16:24,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1761/15526 [32:47<4:16:19,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  11%| | 1761/15526 [32:47<4:16:19,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1762/15526 [32:48<4:16:15,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1762/15526 [32:48<4:16:15,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1763/15526 [32:48<4:16:10,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1763/15526 [32:48<4:16:10,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1764/15526 [32:49<4:16:05,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1764/15526 [32:49<4:16:05,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1765/15526 [32:50<4:16:01,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1765/15526 [32:50<4:16:01,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1766/15526 [32:51<4:16:00,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1766/15526 [32:51<4:16:00,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1767/15526 [32:52<4:16:00,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1767/15526 [32:52<4:16:00,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1768/15526 [32:53<4:15:55,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1768/15526 [32:53<4:15:55,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1769/15526 [32:53<4:15:51,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1769/15526 [32:53<4:15:51,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1770/15526 [32:54<4:15:46,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1770/15526 [32:54<4:15:46,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1771/15526 [32:55<4:15:46,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1771/15526 [32:55<4:15:46,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1772/15526 [32:57<4:15:45,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1772/15526 [32:57<4:15:45,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1773/15526 [32:57<4:15:41,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1773/15526 [32:57<4:15:41,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1774/15526 [32:58<4:15:41,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1774/15526 [32:58<4:15:41,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1775/15526 [33:00<4:15:40,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1775/15526 [33:00<4:15:40,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1776/15526 [33:00<4:15:36,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1776/15526 [33:00<4:15:36,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1777/15526 [33:02<4:15:35,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1777/15526 [33:02<4:15:35,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1778/15526 [33:02<4:15:31,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1778/15526 [33:02<4:15:31,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1779/15526 [33:03<4:15:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1779/15526 [33:03<4:15:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1780/15526 [33:04<4:15:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1780/15526 [33:04<4:15:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1781/15526 [33:05<4:15:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1781/15526 [33:05<4:15:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1782/15526 [33:06<4:15:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1782/15526 [33:06<4:15:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1783/15526 [33:07<4:15:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1783/15526 [33:07<4:15:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1784/15526 [33:08<4:15:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  11%| | 1784/15526 [33:08<4:15:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1785/15526 [33:09<4:15:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1785/15526 [33:09<4:15:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1786/15526 [33:10<4:15:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1786/15526 [33:10<4:15:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1787/15526 [33:11<4:15:11,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1787/15526 [33:11<4:15:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1788/15526 [33:12<4:15:07,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1788/15526 [33:12<4:15:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1789/15526 [33:12<4:15:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1789/15526 [33:12<4:15:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1790/15526 [33:14<4:15:04,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1790/15526 [33:14<4:15:04,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1791/15526 [33:15<4:14:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1791/15526 [33:15<4:14:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1792/15526 [33:22<4:15:50,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1792/15526 [33:22<4:15:50,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1793/15526 [33:24<4:15:50,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1793/15526 [33:24<4:15:50,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1794/15526 [33:25<4:15:50,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1794/15526 [33:25<4:15:50,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1795/15526 [33:26<4:15:45,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1795/15526 [33:26<4:15:45,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1796/15526 [33:26<4:15:41,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1796/15526 [33:26<4:15:41,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1797/15526 [33:27<4:15:37,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1797/15526 [33:27<4:15:37,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1798/15526 [33:28<4:15:32,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1798/15526 [33:28<4:15:32,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1799/15526 [33:28<4:15:28,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1799/15526 [33:28<4:15:28,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1800/15526 [33:30<4:15:27,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1800/15526 [33:30<4:15:27,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1801/15526 [33:31<4:15:27,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1801/15526 [33:31<4:15:27,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1802/15526 [33:31<4:15:22,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1802/15526 [33:31<4:15:22,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1803/15526 [33:32<4:15:18,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1803/15526 [33:32<4:15:18,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1804/15526 [33:33<4:15:18,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1804/15526 [33:33<4:15:18,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1805/15526 [33:34<4:15:13,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1805/15526 [33:34<4:15:13,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1806/15526 [33:35<4:15:09,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1806/15526 [33:35<4:15:09,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1807/15526 [33:35<4:15:04,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1807/15526 [33:35<4:15:04,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1808/15526 [33:37<4:15:04,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1808/15526 [33:37<4:15:04,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1809/15526 [33:37<4:15:00,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1809/15526 [33:37<4:15:00,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1810/15526 [33:38<4:14:55,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1810/15526 [33:38<4:14:55,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1811/15526 [33:39<4:14:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1811/15526 [33:39<4:14:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1812/15526 [33:39<4:14:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1812/15526 [33:39<4:14:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1813/15526 [33:40<4:14:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1813/15526 [33:40<4:14:42,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1814/15526 [33:41<4:14:38,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1814/15526 [33:41<4:14:38,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1815/15526 [33:41<4:14:34,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1815/15526 [33:41<4:14:34,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1816/15526 [33:43<4:14:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1816/15526 [33:43<4:14:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1817/15526 [33:44<4:14:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1817/15526 [33:44<4:14:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1818/15526 [33:45<4:14:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1818/15526 [33:45<4:14:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1819/15526 [33:46<4:14:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1819/15526 [33:46<4:14:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1820/15526 [33:47<4:14:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1820/15526 [33:47<4:14:32,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1821/15526 [33:48<4:14:28,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1821/15526 [33:48<4:14:28,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1822/15526 [33:49<4:14:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1822/15526 [33:49<4:14:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1823/15526 [33:50<4:14:23,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1823/15526 [33:50<4:14:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1824/15526 [33:59<4:15:17,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1824/15526 [33:59<4:15:17,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1825/15526 [33:59<4:15:13,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1825/15526 [33:59<4:15:13,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1826/15526 [34:00<4:15:09,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1826/15526 [34:00<4:15:09,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1827/15526 [34:01<4:15:08,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1827/15526 [34:01<4:15:08,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1828/15526 [34:02<4:15:04,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1828/15526 [34:02<4:15:04,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1829/15526 [34:03<4:14:59,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1829/15526 [34:03<4:14:59,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1830/15526 [34:04<4:14:59,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1830/15526 [34:04<4:14:59,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1831/15526 [34:04<4:14:55,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1831/15526 [34:04<4:14:55,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1832/15526 [34:05<4:14:50,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1832/15526 [34:05<4:14:50,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1833/15526 [34:06<4:14:46,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1833/15526 [34:06<4:14:46,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1834/15526 [34:06<4:14:41,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1834/15526 [34:06<4:14:41,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1835/15526 [34:07<4:14:37,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1835/15526 [34:07<4:14:37,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1836/15526 [34:08<4:14:37,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1836/15526 [34:08<4:14:37,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1837/15526 [34:09<4:14:32,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1837/15526 [34:09<4:14:32,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1838/15526 [34:10<4:14:28,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1838/15526 [34:10<4:14:28,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1839/15526 [34:10<4:14:24,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1839/15526 [34:10<4:14:24,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1840/15526 [34:11<4:14:19,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1840/15526 [34:11<4:14:19,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1841/15526 [34:12<4:14:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1841/15526 [34:12<4:14:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1842/15526 [34:13<4:14:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1842/15526 [34:13<4:14:15,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1843/15526 [34:14<4:14:15,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1843/15526 [34:14<4:14:15,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1844/15526 [34:15<4:14:10,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1844/15526 [34:15<4:14:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1845/15526 [34:16<4:14:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1845/15526 [34:16<4:14:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1846/15526 [34:17<4:14:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1846/15526 [34:17<4:14:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1847/15526 [34:18<4:14:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1847/15526 [34:18<4:14:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1848/15526 [34:19<4:14:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1848/15526 [34:19<4:14:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1849/15526 [34:20<4:14:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1849/15526 [34:20<4:14:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1850/15526 [34:21<4:13:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1850/15526 [34:21<4:13:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1851/15526 [34:22<4:13:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1851/15526 [34:22<4:13:56,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1852/15526 [34:23<4:13:51,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1852/15526 [34:23<4:13:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1853/15526 [34:23<4:13:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1853/15526 [34:23<4:13:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1854/15526 [34:24<4:13:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1854/15526 [34:24<4:13:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1855/15526 [34:25<4:13:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1855/15526 [34:25<4:13:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1856/15526 [34:32<4:14:27,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1856/15526 [34:32<4:14:27,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1857/15526 [34:33<4:14:23,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1857/15526 [34:33<4:14:23,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1858/15526 [34:34<4:14:18,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1858/15526 [34:34<4:14:18,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1859/15526 [34:35<4:14:18,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1859/15526 [34:35<4:14:18,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1860/15526 [34:36<4:14:14,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1860/15526 [34:36<4:14:14,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1861/15526 [34:36<4:14:09,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1861/15526 [34:36<4:14:09,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1862/15526 [34:38<4:14:09,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1862/15526 [34:38<4:14:09,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1863/15526 [34:38<4:14:05,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1863/15526 [34:38<4:14:05,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1864/15526 [34:39<4:14:01,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1864/15526 [34:39<4:14:01,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1865/15526 [34:40<4:14:00,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1865/15526 [34:40<4:14:00,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1866/15526 [34:41<4:14:00,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1866/15526 [34:41<4:14:00,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1867/15526 [34:42<4:13:56,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1867/15526 [34:42<4:13:56,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1868/15526 [34:43<4:13:56,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1868/15526 [34:43<4:13:56,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1869/15526 [34:45<4:13:55,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1869/15526 [34:45<4:13:55,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1870/15526 [34:45<4:13:51,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1870/15526 [34:45<4:13:51,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1871/15526 [34:46<4:13:47,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1871/15526 [34:46<4:13:47,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1872/15526 [34:47<4:13:47,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1872/15526 [34:47<4:13:47,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1873/15526 [34:48<4:13:43,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1873/15526 [34:48<4:13:43,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1874/15526 [34:49<4:13:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1874/15526 [34:49<4:13:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1875/15526 [34:49<4:13:34,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1875/15526 [34:49<4:13:34,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1876/15526 [34:51<4:13:34,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1876/15526 [34:51<4:13:34,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1877/15526 [34:52<4:13:34,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1877/15526 [34:52<4:13:34,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1878/15526 [34:52<4:13:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1878/15526 [34:52<4:13:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1879/15526 [34:53<4:13:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1879/15526 [34:53<4:13:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1880/15526 [34:54<4:13:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1880/15526 [34:54<4:13:25,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1881/15526 [34:55<4:13:21,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1881/15526 [34:55<4:13:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1882/15526 [34:56<4:13:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1882/15526 [34:56<4:13:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1883/15526 [34:56<4:13:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1883/15526 [34:56<4:13:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1884/15526 [34:57<4:13:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1884/15526 [34:57<4:13:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1885/15526 [34:58<4:13:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1885/15526 [34:58<4:13:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1886/15526 [34:58<4:12:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1886/15526 [34:58<4:12:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1887/15526 [35:00<4:12:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1887/15526 [35:00<4:12:59,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1888/15526 [35:08<4:13:49,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1888/15526 [35:08<4:13:49,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1889/15526 [35:08<4:13:44,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1889/15526 [35:08<4:13:44,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1890/15526 [35:10<4:13:44,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1890/15526 [35:10<4:13:44,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1891/15526 [35:10<4:13:39,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1891/15526 [35:10<4:13:39,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1892/15526 [35:11<4:13:39,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1892/15526 [35:12<4:13:39,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1893/15526 [35:13<4:13:38,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1893/15526 [35:13<4:13:38,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1894/15526 [35:13<4:13:34,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1894/15526 [35:13<4:13:34,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1895/15526 [35:15<4:13:34,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1895/15526 [35:15<4:13:34,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1896/15526 [35:15<4:13:30,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1896/15526 [35:15<4:13:30,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1897/15526 [35:16<4:13:25,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1897/15526 [35:16<4:13:25,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1898/15526 [35:17<4:13:21,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1898/15526 [35:17<4:13:21,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1899/15526 [35:17<4:13:17,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1899/15526 [35:17<4:13:17,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1900/15526 [35:18<4:13:13,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1900/15526 [35:18<4:13:13,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1901/15526 [35:19<4:13:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1901/15526 [35:19<4:13:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1902/15526 [35:20<4:13:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1902/15526 [35:20<4:13:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1903/15526 [35:21<4:13:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1903/15526 [35:21<4:13:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1904/15526 [35:22<4:13:04,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1904/15526 [35:22<4:13:04,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1905/15526 [35:23<4:13:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1905/15526 [35:23<4:13:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1906/15526 [35:23<4:12:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1906/15526 [35:23<4:12:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1907/15526 [35:24<4:12:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1907/15526 [35:24<4:12:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1908/15526 [35:25<4:12:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1908/15526 [35:25<4:12:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1909/15526 [35:25<4:12:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1909/15526 [35:25<4:12:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1910/15526 [35:26<4:12:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1910/15526 [35:26<4:12:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1911/15526 [35:27<4:12:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1911/15526 [35:27<4:12:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1912/15526 [35:27<4:12:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1912/15526 [35:27<4:12:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1913/15526 [35:29<4:12:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1913/15526 [35:29<4:12:30,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1914/15526 [35:29<4:12:26,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1914/15526 [35:29<4:12:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1915/15526 [35:31<4:12:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1915/15526 [35:31<4:12:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1916/15526 [35:32<4:12:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1916/15526 [35:32<4:12:26,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1917/15526 [35:33<4:12:25,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1917/15526 [35:33<4:12:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1918/15526 [35:34<4:12:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1918/15526 [35:34<4:12:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1919/15526 [35:35<4:12:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1919/15526 [35:35<4:12:21,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1920/15526 [35:44<4:13:16,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1920/15526 [35:44<4:13:16,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1921/15526 [35:45<4:13:12,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1921/15526 [35:45<4:13:12,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1922/15526 [35:46<4:13:11,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1922/15526 [35:46<4:13:11,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1923/15526 [35:47<4:13:11,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1923/15526 [35:47<4:13:11,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1924/15526 [35:48<4:13:07,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1924/15526 [35:48<4:13:07,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1925/15526 [35:48<4:13:03,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1925/15526 [35:48<4:13:03,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1926/15526 [35:49<4:12:59,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1926/15526 [35:49<4:12:59,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1927/15526 [35:50<4:12:54,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1927/15526 [35:50<4:12:54,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1928/15526 [35:51<4:12:54,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1928/15526 [35:51<4:12:54,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1929/15526 [35:52<4:12:50,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1929/15526 [35:52<4:12:50,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1930/15526 [35:52<4:12:45,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1930/15526 [35:52<4:12:45,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1931/15526 [35:53<4:12:41,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1931/15526 [35:53<4:12:41,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1932/15526 [35:54<4:12:37,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1932/15526 [35:54<4:12:37,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1933/15526 [35:54<4:12:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1933/15526 [35:54<4:12:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1934/15526 [35:55<4:12:29,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1934/15526 [35:55<4:12:29,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1935/15526 [35:56<4:12:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1935/15526 [35:56<4:12:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1936/15526 [35:56<4:12:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1936/15526 [35:56<4:12:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1937/15526 [35:57<4:12:17,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1937/15526 [35:57<4:12:17,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1938/15526 [35:58<4:12:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1938/15526 [35:58<4:12:16,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1939/15526 [35:59<4:12:12,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  12%| | 1939/15526 [35:59<4:12:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1940/15526 [36:00<4:12:11,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  12%| | 1940/15526 [36:00<4:12:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1941/15526 [36:01<4:12:11,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1941/15526 [36:01<4:12:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1942/15526 [36:02<4:12:07,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1942/15526 [36:02<4:12:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1943/15526 [36:03<4:12:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1943/15526 [36:03<4:12:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1944/15526 [36:05<4:12:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1944/15526 [36:05<4:12:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1945/15526 [36:05<4:12:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1945/15526 [36:05<4:12:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1946/15526 [36:06<4:12:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1946/15526 [36:06<4:12:01,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1947/15526 [36:07<4:11:57,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 1947/15526 [36:07<4:11:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1948/15526 [36:08<4:11:53,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1948/15526 [36:08<4:11:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1949/15526 [36:09<4:11:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1949/15526 [36:09<4:11:49,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1950/15526 [36:09<4:11:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1950/15526 [36:09<4:11:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1951/15526 [36:10<4:11:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1951/15526 [36:10<4:11:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1952/15526 [36:19<4:12:33,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1952/15526 [36:19<4:12:33,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1953/15526 [36:19<4:12:29,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1953/15526 [36:19<4:12:29,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1954/15526 [36:20<4:12:25,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1954/15526 [36:20<4:12:25,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1955/15526 [36:21<4:12:21,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1955/15526 [36:21<4:12:21,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1956/15526 [36:21<4:12:17,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1956/15526 [36:21<4:12:17,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1957/15526 [36:23<4:12:16,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1957/15526 [36:23<4:12:16,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1958/15526 [36:23<4:12:12,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1958/15526 [36:23<4:12:12,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1959/15526 [36:24<4:12:08,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1959/15526 [36:24<4:12:08,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1960/15526 [36:25<4:12:04,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1960/15526 [36:25<4:12:04,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1961/15526 [36:26<4:12:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1961/15526 [36:26<4:12:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1962/15526 [36:26<4:11:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1962/15526 [36:26<4:11:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1963/15526 [36:27<4:11:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1963/15526 [36:27<4:11:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1964/15526 [36:28<4:11:54,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1964/15526 [36:28<4:11:54,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1965/15526 [36:30<4:11:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1965/15526 [36:30<4:11:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1966/15526 [36:31<4:11:53,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1966/15526 [36:31<4:11:53,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1967/15526 [36:31<4:11:48,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 1967/15526 [36:31<4:11:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1968/15526 [36:33<4:11:48,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1968/15526 [36:33<4:11:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1969/15526 [36:33<4:11:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1969/15526 [36:33<4:11:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1970/15526 [36:34<4:11:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1970/15526 [36:34<4:11:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1971/15526 [36:36<4:11:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1971/15526 [36:36<4:11:42,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1972/15526 [36:37<4:11:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1972/15526 [36:37<4:11:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1973/15526 [36:37<4:11:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1973/15526 [36:37<4:11:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1974/15526 [36:39<4:11:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1974/15526 [36:39<4:11:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1975/15526 [36:39<4:11:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1975/15526 [36:39<4:11:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1976/15526 [36:40<4:11:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1976/15526 [36:40<4:11:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1977/15526 [36:41<4:11:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1977/15526 [36:41<4:11:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1978/15526 [36:42<4:11:23,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1978/15526 [36:42<4:11:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1979/15526 [36:43<4:11:23,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1979/15526 [36:43<4:11:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1980/15526 [36:44<4:11:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1980/15526 [36:44<4:11:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1981/15526 [36:44<4:11:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1981/15526 [36:44<4:11:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1982/15526 [36:45<4:11:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1982/15526 [36:45<4:11:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1983/15526 [36:46<4:11:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1983/15526 [36:46<4:11:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1984/15526 [36:52<4:11:42,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1984/15526 [36:52<4:11:42,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1985/15526 [36:53<4:11:42,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1985/15526 [36:53<4:11:42,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1986/15526 [36:55<4:11:42,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1986/15526 [36:55<4:11:42,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1987/15526 [36:55<4:11:38,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1987/15526 [36:55<4:11:38,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1988/15526 [36:56<4:11:34,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1988/15526 [36:56<4:11:34,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1989/15526 [36:57<4:11:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1989/15526 [36:57<4:11:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1990/15526 [36:57<4:11:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1990/15526 [36:57<4:11:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1991/15526 [36:59<4:11:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1991/15526 [36:59<4:11:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1992/15526 [37:00<4:11:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1992/15526 [37:00<4:11:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1993/15526 [37:00<4:11:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1993/15526 [37:00<4:11:20,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1994/15526 [37:01<4:11:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1994/15526 [37:01<4:11:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1995/15526 [37:02<4:11:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1995/15526 [37:02<4:11:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1996/15526 [37:03<4:11:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1996/15526 [37:03<4:11:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1997/15526 [37:04<4:11:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1997/15526 [37:04<4:11:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1998/15526 [37:04<4:11:04,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1998/15526 [37:04<4:11:04,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1999/15526 [37:05<4:11:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1999/15526 [37:05<4:11:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2000/15526 [37:06<4:10:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2000/15526 [37:06<4:10:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2001/15526 [37:07<4:10:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2001/15526 [37:07<4:10:56,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2002/15526 [37:08<4:10:55,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 2002/15526 [37:08<4:10:55,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2003/15526 [37:09<4:10:55,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 2003/15526 [37:09<4:10:55,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2004/15526 [37:10<4:10:51,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 2004/15526 [37:10<4:10:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2005/15526 [37:11<4:10:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2005/15526 [37:11<4:10:50,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2006/15526 [37:12<4:10:46,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2006/15526 [37:12<4:10:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2007/15526 [37:13<4:10:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2007/15526 [37:13<4:10:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2008/15526 [37:14<4:10:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2008/15526 [37:14<4:10:42,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2009/15526 [37:15<4:10:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2009/15526 [37:15<4:10:42,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2010/15526 [37:16<4:10:41,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 2010/15526 [37:16<4:10:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2011/15526 [37:17<4:10:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2011/15526 [37:17<4:10:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2012/15526 [37:18<4:10:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2012/15526 [37:18<4:10:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2013/15526 [37:18<4:10:29,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2013/15526 [37:18<4:10:29,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2014/15526 [37:19<4:10:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2014/15526 [37:19<4:10:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2015/15526 [37:20<4:10:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2015/15526 [37:20<4:10:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2016/15526 [37:27<4:10:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2016/15526 [37:27<4:10:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2017/15526 [37:27<4:10:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2017/15526 [37:27<4:10:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2018/15526 [37:28<4:10:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2018/15526 [37:28<4:10:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2019/15526 [37:29<4:10:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2019/15526 [37:29<4:10:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2020/15526 [37:30<4:10:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2020/15526 [37:30<4:10:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2021/15526 [37:31<4:10:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2021/15526 [37:31<4:10:42,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2022/15526 [37:31<4:10:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2022/15526 [37:31<4:10:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2023/15526 [37:32<4:10:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2023/15526 [37:32<4:10:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2024/15526 [37:33<4:10:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2024/15526 [37:33<4:10:33,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2025/15526 [37:34<4:10:32,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 2025/15526 [37:34<4:10:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2026/15526 [37:35<4:10:28,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2026/15526 [37:35<4:10:28,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2027/15526 [37:36<4:10:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2027/15526 [37:36<4:10:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2028/15526 [37:36<4:10:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2028/15526 [37:36<4:10:20,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2029/15526 [37:37<4:10:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2029/15526 [37:37<4:10:19,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2030/15526 [37:39<4:10:18,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 2030/15526 [37:39<4:10:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2031/15526 [37:40<4:10:18,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2031/15526 [37:40<4:10:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2032/15526 [37:40<4:10:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2032/15526 [37:40<4:10:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2033/15526 [37:41<4:10:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2033/15526 [37:41<4:10:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2034/15526 [37:42<4:10:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2034/15526 [37:42<4:10:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2035/15526 [37:42<4:10:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2035/15526 [37:42<4:10:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2036/15526 [37:43<4:09:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2036/15526 [37:43<4:09:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2037/15526 [37:44<4:09:53,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2037/15526 [37:44<4:09:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2038/15526 [37:44<4:09:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2038/15526 [37:44<4:09:49,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2039/15526 [37:45<4:09:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2039/15526 [37:45<4:09:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2040/15526 [37:46<4:09:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2040/15526 [37:46<4:09:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2041/15526 [37:47<4:09:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2041/15526 [37:47<4:09:44,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2042/15526 [37:49<4:09:43,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 2042/15526 [37:49<4:09:43,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2043/15526 [37:49<4:09:39,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 2043/15526 [37:49<4:09:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2044/15526 [37:50<4:09:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2044/15526 [37:50<4:09:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2045/15526 [37:51<4:09:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2045/15526 [37:51<4:09:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2046/15526 [37:52<4:09:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2046/15526 [37:52<4:09:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2047/15526 [37:52<4:09:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2047/15526 [37:52<4:09:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2048/15526 [38:01<4:10:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2048/15526 [38:01<4:10:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2049/15526 [38:02<4:10:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2049/15526 [38:02<4:10:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2050/15526 [38:03<4:10:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2050/15526 [38:03<4:10:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2051/15526 [38:03<4:10:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2051/15526 [38:03<4:10:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2052/15526 [38:05<4:10:04,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2052/15526 [38:05<4:10:04,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2053/15526 [38:05<4:10:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2053/15526 [38:05<4:10:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2054/15526 [38:06<4:10:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2054/15526 [38:06<4:10:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2055/15526 [38:07<4:09:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2055/15526 [38:07<4:09:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2056/15526 [38:08<4:09:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2056/15526 [38:08<4:09:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2057/15526 [38:09<4:09:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2057/15526 [38:09<4:09:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2058/15526 [38:10<4:09:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2058/15526 [38:10<4:09:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2059/15526 [38:11<4:09:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2059/15526 [38:11<4:09:46,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2060/15526 [38:12<4:09:46,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 2060/15526 [38:12<4:09:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2061/15526 [38:13<4:09:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2061/15526 [38:13<4:09:42,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2062/15526 [38:13<4:09:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|���| 2062/15526 [38:13<4:09:38,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2063/15526 [38:15<4:09:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2063/15526 [38:15<4:09:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2064/15526 [38:16<4:09:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2064/15526 [38:16<4:09:36,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2065/15526 [38:16<4:09:32,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 2065/15526 [38:16<4:09:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2066/15526 [38:17<4:09:28,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2066/15526 [38:17<4:09:28,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2067/15526 [38:18<4:09:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2067/15526 [38:18<4:09:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2068/15526 [38:19<4:09:23,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2068/15526 [38:19<4:09:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2069/15526 [38:19<4:09:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2069/15526 [38:19<4:09:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2070/15526 [38:20<4:09:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2070/15526 [38:20<4:09:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2071/15526 [38:21<4:09:11,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2071/15526 [38:21<4:09:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2072/15526 [38:22<4:09:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2072/15526 [38:22<4:09:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2073/15526 [38:23<4:09:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2073/15526 [38:23<4:09:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2074/15526 [38:23<4:09:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2074/15526 [38:23<4:09:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2075/15526 [38:24<4:08:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2075/15526 [38:24<4:08:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2076/15526 [38:25<4:08:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2076/15526 [38:25<4:08:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2077/15526 [38:26<4:08:54,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2077/15526 [38:26<4:08:54,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2078/15526 [38:27<4:08:53,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 2078/15526 [38:27<4:08:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2079/15526 [38:28<4:08:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2079/15526 [38:28<4:08:50,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2080/15526 [38:37<4:09:38,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2080/15526 [38:37<4:09:38,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2081/15526 [38:38<4:09:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2081/15526 [38:38<4:09:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2082/15526 [38:39<4:09:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2082/15526 [38:39<4:09:37,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2083/15526 [38:40<4:09:36,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 2083/15526 [38:40<4:09:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2084/15526 [38:41<4:09:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2084/15526 [38:41<4:09:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2085/15526 [38:41<4:09:28,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2085/15526 [38:41<4:09:28,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2086/15526 [38:43<4:09:28,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2086/15526 [38:43<4:09:28,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2087/15526 [38:44<4:09:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2087/15526 [38:44<4:09:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2088/15526 [38:45<4:09:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2088/15526 [38:45<4:09:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2089/15526 [38:46<4:09:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2089/15526 [38:46<4:09:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2090/15526 [38:46<4:09:18,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2090/15526 [38:46<4:09:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2091/15526 [38:47<4:09:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2091/15526 [38:47<4:09:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2092/15526 [38:48<4:09:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2092/15526 [38:48<4:09:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2093/15526 [38:48<4:09:07,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2093/15526 [38:48<4:09:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2094/15526 [38:49<4:09:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2094/15526 [38:49<4:09:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2095/15526 [38:50<4:08:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2095/15526 [38:50<4:08:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 2096/15526 [38:50<4:08:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 2096/15526 [38:50<4:08:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2097/15526 [38:51<4:08:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2097/15526 [38:51<4:08:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2098/15526 [38:52<4:08:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2098/15526 [38:52<4:08:50,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2099/15526 [38:53<4:08:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2099/15526 [38:53<4:08:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2100/15526 [38:54<4:08:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2100/15526 [38:54<4:08:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2101/15526 [38:55<4:08:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2101/15526 [38:55<4:08:42,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2102/15526 [38:55<4:08:38,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 2102/15526 [38:55<4:08:38,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2103/15526 [38:56<4:08:34,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2103/15526 [38:56<4:08:34,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2104/15526 [38:57<4:08:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2104/15526 [38:57<4:08:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2105/15526 [38:58<4:08:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2105/15526 [38:58<4:08:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2106/15526 [38:58<4:08:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2106/15526 [38:58<4:08:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2107/15526 [38:59<4:08:18,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2107/15526 [38:59<4:08:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2108/15526 [39:00<4:08:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2108/15526 [39:00<4:08:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2109/15526 [39:00<4:08:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2109/15526 [39:00<4:08:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2110/15526 [39:01<4:08:07,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2110/15526 [39:01<4:08:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2111/15526 [39:02<4:08:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2111/15526 [39:02<4:08:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2112/15526 [39:09<4:08:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2112/15526 [39:09<4:08:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2113/15526 [39:10<4:08:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2113/15526 [39:10<4:08:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2114/15526 [39:11<4:08:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2114/15526 [39:11<4:08:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2115/15526 [39:12<4:08:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2115/15526 [39:12<4:08:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2116/15526 [39:12<4:08:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2116/15526 [39:12<4:08:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2117/15526 [39:14<4:08:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2117/15526 [39:14<4:08:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2118/15526 [39:14<4:08:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2118/15526 [39:14<4:08:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2119/15526 [39:15<4:08:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2119/15526 [39:15<4:08:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2120/15526 [39:16<4:08:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2120/15526 [39:16<4:08:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2121/15526 [39:17<4:08:18,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2121/15526 [39:17<4:08:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2122/15526 [39:17<4:08:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2122/15526 [39:17<4:08:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2123/15526 [39:18<4:08:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2123/15526 [39:18<4:08:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2124/15526 [39:19<4:08:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2124/15526 [39:19<4:08:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2125/15526 [39:20<4:08:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2125/15526 [39:20<4:08:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2126/15526 [39:21<4:08:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2126/15526 [39:21<4:08:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2127/15526 [39:22<4:08:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2127/15526 [39:22<4:08:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2128/15526 [39:22<4:07:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2128/15526 [39:22<4:07:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2129/15526 [39:23<4:07:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2129/15526 [39:23<4:07:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2130/15526 [39:24<4:07:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2130/15526 [39:24<4:07:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2131/15526 [39:25<4:07:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2131/15526 [39:25<4:07:51,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2132/15526 [39:26<4:07:47,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 2132/15526 [39:26<4:07:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2133/15526 [39:27<4:07:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2133/15526 [39:27<4:07:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2134/15526 [39:28<4:07:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2134/15526 [39:28<4:07:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2135/15526 [39:29<4:07:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2135/15526 [39:29<4:07:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2136/15526 [39:30<4:07:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2136/15526 [39:30<4:07:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2137/15526 [39:31<4:07:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2137/15526 [39:31<4:07:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2138/15526 [39:32<4:07:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2138/15526 [39:32<4:07:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2139/15526 [39:33<4:07:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2139/15526 [39:33<4:07:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2140/15526 [39:34<4:07:34,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2140/15526 [39:34<4:07:34,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2141/15526 [39:35<4:07:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2141/15526 [39:35<4:07:33,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2142/15526 [39:36<4:07:29,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 2142/15526 [39:36<4:07:29,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2143/15526 [39:37<4:07:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2143/15526 [39:37<4:07:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2144/15526 [39:45<4:08:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2144/15526 [39:45<4:08:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2145/15526 [39:45<4:08:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2145/15526 [39:45<4:08:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2146/15526 [39:46<4:08:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2146/15526 [39:46<4:08:02,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2147/15526 [39:48<4:08:01,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 2147/15526 [39:48<4:08:01,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2148/15526 [39:48<4:07:58,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 2148/15526 [39:48<4:07:58,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2149/15526 [39:50<4:07:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2149/15526 [39:50<4:07:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2150/15526 [39:50<4:07:53,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2150/15526 [39:50<4:07:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2151/15526 [39:51<4:07:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2151/15526 [39:51<4:07:49,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2152/15526 [39:52<4:07:48,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2152/15526 [39:52<4:07:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2153/15526 [39:53<4:07:48,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2153/15526 [39:53<4:07:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2154/15526 [39:54<4:07:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2154/15526 [39:54<4:07:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2155/15526 [39:55<4:07:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2155/15526 [39:55<4:07:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2156/15526 [39:56<4:07:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2156/15526 [39:56<4:07:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2157/15526 [39:57<4:07:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2157/15526 [39:57<4:07:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2158/15526 [39:58<4:07:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2158/15526 [39:58<4:07:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2159/15526 [39:58<4:07:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2159/15526 [39:58<4:07:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2160/15526 [39:59<4:07:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2160/15526 [39:59<4:07:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2161/15526 [40:00<4:07:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2161/15526 [40:00<4:07:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2162/15526 [40:00<4:07:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2162/15526 [40:00<4:07:20,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2163/15526 [40:01<4:07:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2163/15526 [40:01<4:07:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2164/15526 [40:02<4:07:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2164/15526 [40:02<4:07:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2165/15526 [40:03<4:07:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2165/15526 [40:03<4:07:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2166/15526 [40:04<4:07:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2166/15526 [40:04<4:07:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2167/15526 [40:04<4:07:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2167/15526 [40:04<4:07:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2168/15526 [40:05<4:07:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2168/15526 [40:05<4:07:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2169/15526 [40:06<4:06:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2169/15526 [40:06<4:06:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2170/15526 [40:07<4:06:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2170/15526 [40:07<4:06:57,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2171/15526 [40:08<4:06:53,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 2171/15526 [40:08<4:06:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2172/15526 [40:08<4:06:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2172/15526 [40:08<4:06:49,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2173/15526 [40:09<4:06:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2173/15526 [40:09<4:06:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2174/15526 [40:10<4:06:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2174/15526 [40:10<4:06:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2175/15526 [40:11<4:06:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2175/15526 [40:11<4:06:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2176/15526 [40:19<4:07:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2176/15526 [40:19<4:07:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2177/15526 [40:19<4:07:18,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2177/15526 [40:19<4:07:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2178/15526 [40:21<4:07:18,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2178/15526 [40:21<4:07:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2179/15526 [40:21<4:07:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2179/15526 [40:21<4:07:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2180/15526 [40:22<4:07:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2180/15526 [40:22<4:07:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2181/15526 [40:23<4:07:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2181/15526 [40:23<4:07:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2182/15526 [40:24<4:07:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2182/15526 [40:24<4:07:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2183/15526 [40:25<4:07:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2183/15526 [40:25<4:07:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2184/15526 [40:26<4:07:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2184/15526 [40:26<4:07:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2185/15526 [40:27<4:07:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2185/15526 [40:27<4:07:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2186/15526 [40:28<4:06:58,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2186/15526 [40:28<4:06:58,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2187/15526 [40:28<4:06:54,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2187/15526 [40:28<4:06:54,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2188/15526 [40:29<4:06:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2188/15526 [40:29<4:06:50,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2189/15526 [40:30<4:06:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2189/15526 [40:30<4:06:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2190/15526 [40:31<4:06:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2190/15526 [40:31<4:06:46,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2191/15526 [40:32<4:06:46,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 2191/15526 [40:32<4:06:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2192/15526 [40:33<4:06:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2192/15526 [40:33<4:06:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2193/15526 [40:35<4:06:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2193/15526 [40:35<4:06:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2194/15526 [40:35<4:06:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2194/15526 [40:35<4:06:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2195/15526 [40:36<4:06:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2195/15526 [40:36<4:06:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2196/15526 [40:37<4:06:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2196/15526 [40:37<4:06:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2197/15526 [40:38<4:06:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2197/15526 [40:38<4:06:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2198/15526 [40:39<4:06:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2198/15526 [40:39<4:06:32,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2199/15526 [40:40<4:06:32,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 2199/15526 [40:40<4:06:32,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2200/15526 [40:41<4:06:31,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 2200/15526 [40:41<4:06:31,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2201/15526 [40:42<4:06:28,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 2201/15526 [40:42<4:06:28,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2202/15526 [40:43<4:06:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2202/15526 [40:43<4:06:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2203/15526 [40:44<4:06:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2203/15526 [40:44<4:06:20,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2204/15526 [40:44<4:06:17,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2204/15526 [40:44<4:06:17,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2205/15526 [40:45<4:06:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2205/15526 [40:45<4:06:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2206/15526 [40:46<4:06:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2206/15526 [40:46<4:06:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2207/15526 [40:46<4:06:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2207/15526 [40:46<4:06:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2208/15526 [40:54<4:06:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2208/15526 [40:54<4:06:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2209/15526 [40:55<4:06:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2209/15526 [40:55<4:06:42,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2210/15526 [40:56<4:06:38,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2210/15526 [40:56<4:06:38,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2211/15526 [40:56<4:06:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2211/15526 [40:56<4:06:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2212/15526 [40:57<4:06:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2212/15526 [40:57<4:06:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2213/15526 [40:58<4:06:28,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2213/15526 [40:58<4:06:28,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2214/15526 [40:59<4:06:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2214/15526 [40:59<4:06:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2215/15526 [41:00<4:06:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2215/15526 [41:00<4:06:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2216/15526 [41:00<4:06:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2216/15526 [41:00<4:06:20,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2217/15526 [41:02<4:06:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2217/15526 [41:02<4:06:20,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2218/15526 [41:02<4:06:16,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 2218/15526 [41:02<4:06:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2219/15526 [41:03<4:06:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2219/15526 [41:03<4:06:16,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2220/15526 [41:04<4:06:12,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 2220/15526 [41:04<4:06:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2221/15526 [41:05<4:06:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2221/15526 [41:05<4:06:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2222/15526 [41:06<4:06:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2222/15526 [41:06<4:06:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2223/15526 [41:06<4:06:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2223/15526 [41:06<4:06:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2224/15526 [41:07<4:05:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2224/15526 [41:07<4:05:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2225/15526 [41:08<4:05:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2225/15526 [41:08<4:05:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2226/15526 [41:09<4:05:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2226/15526 [41:09<4:05:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2227/15526 [41:10<4:05:53,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2227/15526 [41:10<4:05:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2228/15526 [41:11<4:05:52,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2228/15526 [41:11<4:05:52,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2229/15526 [41:12<4:05:52,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2229/15526 [41:12<4:05:52,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2230/15526 [41:14<4:05:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2230/15526 [41:14<4:05:51,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2231/15526 [41:14<4:05:48,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 2231/15526 [41:14<4:05:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2232/15526 [41:15<4:05:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2232/15526 [41:15<4:05:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2233/15526 [41:16<4:05:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2233/15526 [41:16<4:05:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2234/15526 [41:17<4:05:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2234/15526 [41:17<4:05:43,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2235/15526 [41:18<4:05:40,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 2235/15526 [41:18<4:05:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2236/15526 [41:19<4:05:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2236/15526 [41:19<4:05:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2237/15526 [41:20<4:05:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2237/15526 [41:20<4:05:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2238/15526 [41:21<4:05:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2238/15526 [41:21<4:05:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2239/15526 [41:21<4:05:28,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2239/15526 [41:21<4:05:28,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2240/15526 [41:28<4:05:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2240/15526 [41:28<4:05:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2241/15526 [41:29<4:05:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2241/15526 [41:29<4:05:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2242/15526 [41:29<4:05:52,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2242/15526 [41:29<4:05:52,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2243/15526 [41:30<4:05:48,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2243/15526 [41:30<4:05:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2244/15526 [41:31<4:05:48,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2244/15526 [41:31<4:05:48,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2245/15526 [41:32<4:05:47,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 2245/15526 [41:32<4:05:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2246/15526 [41:33<4:05:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2246/15526 [41:33<4:05:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2247/15526 [41:34<4:05:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2247/15526 [41:34<4:05:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2248/15526 [41:34<4:05:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2248/15526 [41:34<4:05:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2249/15526 [41:35<4:05:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2249/15526 [41:35<4:05:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2250/15526 [41:36<4:05:29,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2250/15526 [41:36<4:05:29,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 2251/15526 [41:37<4:05:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 2251/15526 [41:37<4:05:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2252/15526 [41:38<4:05:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2252/15526 [41:38<4:05:25,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2253/15526 [41:39<4:05:22,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2253/15526 [41:39<4:05:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2254/15526 [41:40<4:05:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2254/15526 [41:40<4:05:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2255/15526 [41:41<4:05:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2255/15526 [41:41<4:05:21,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2256/15526 [41:42<4:05:17,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2256/15526 [41:42<4:05:17,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2257/15526 [41:42<4:05:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2257/15526 [41:42<4:05:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2258/15526 [41:44<4:05:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2258/15526 [41:44<4:05:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2259/15526 [41:44<4:05:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2259/15526 [41:44<4:05:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2260/15526 [41:46<4:05:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2260/15526 [41:46<4:05:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2261/15526 [41:46<4:05:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2261/15526 [41:46<4:05:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2262/15526 [41:47<4:05:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2262/15526 [41:47<4:05:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2263/15526 [41:48<4:04:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2263/15526 [41:48<4:04:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2264/15526 [41:49<4:04:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2264/15526 [41:49<4:04:59,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2265/15526 [41:50<4:04:58,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2265/15526 [41:50<4:04:58,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2266/15526 [41:51<4:04:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2266/15526 [41:51<4:04:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2267/15526 [41:51<4:04:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2267/15526 [41:51<4:04:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2268/15526 [41:52<4:04:48,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2268/15526 [41:52<4:04:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2269/15526 [41:53<4:04:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2269/15526 [41:53<4:04:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2270/15526 [41:54<4:04:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2270/15526 [41:54<4:04:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2271/15526 [41:54<4:04:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2271/15526 [41:54<4:04:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2272/15526 [42:03<4:05:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2272/15526 [42:03<4:05:20,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2273/15526 [42:04<4:05:17,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2273/15526 [42:04<4:05:17,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2274/15526 [42:05<4:05:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2274/15526 [42:05<4:05:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2275/15526 [42:06<4:05:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2275/15526 [42:06<4:05:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2276/15526 [42:07<4:05:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2276/15526 [42:07<4:05:12,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2277/15526 [42:07<4:05:08,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2277/15526 [42:07<4:05:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2278/15526 [42:08<4:05:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2278/15526 [42:08<4:05:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2279/15526 [42:09<4:05:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2279/15526 [42:09<4:05:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2280/15526 [42:09<4:04:58,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2280/15526 [42:09<4:04:58,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2281/15526 [42:10<4:04:54,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2281/15526 [42:10<4:04:54,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2282/15526 [42:11<4:04:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2282/15526 [42:11<4:04:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2283/15526 [42:12<4:04:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2283/15526 [42:12<4:04:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2284/15526 [42:12<4:04:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2284/15526 [42:12<4:04:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2285/15526 [42:13<4:04:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2285/15526 [42:13<4:04:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2286/15526 [42:14<4:04:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2286/15526 [42:14<4:04:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2287/15526 [42:14<4:04:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2287/15526 [42:14<4:04:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2288/15526 [42:16<4:04:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2288/15526 [42:16<4:04:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2289/15526 [42:16<4:04:29,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2289/15526 [42:16<4:04:29,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2290/15526 [42:17<4:04:29,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2290/15526 [42:17<4:04:29,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2291/15526 [42:18<4:04:25,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2291/15526 [42:18<4:04:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2292/15526 [42:19<4:04:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2292/15526 [42:19<4:04:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2293/15526 [42:20<4:04:18,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2293/15526 [42:20<4:04:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2294/15526 [42:20<4:04:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2294/15526 [42:20<4:04:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2295/15526 [42:22<4:04:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2295/15526 [42:22<4:04:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2296/15526 [42:22<4:04:11,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2296/15526 [42:22<4:04:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2297/15526 [42:23<4:04:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2297/15526 [42:23<4:04:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2298/15526 [42:24<4:04:04,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2298/15526 [42:24<4:04:04,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2299/15526 [42:24<4:04:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2299/15526 [42:24<4:04:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2300/15526 [42:25<4:04:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2300/15526 [42:25<4:04:00,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2301/15526 [42:26<4:03:56,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2301/15526 [42:26<4:03:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2302/15526 [42:27<4:03:53,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2302/15526 [42:27<4:03:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2303/15526 [42:28<4:03:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2303/15526 [42:28<4:03:49,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2304/15526 [42:39<4:04:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2304/15526 [42:39<4:04:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2305/15526 [42:40<4:04:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2305/15526 [42:40<4:04:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2306/15526 [42:41<4:04:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2306/15526 [42:41<4:04:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2307/15526 [42:41<4:04:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2307/15526 [42:41<4:04:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2308/15526 [42:42<4:04:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2308/15526 [42:42<4:04:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2309/15526 [42:43<4:04:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2309/15526 [42:43<4:04:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2310/15526 [42:44<4:04:29,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2310/15526 [42:44<4:04:29,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2311/15526 [42:44<4:04:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2311/15526 [42:44<4:04:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2312/15526 [42:46<4:04:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2312/15526 [42:46<4:04:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2313/15526 [42:46<4:04:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2313/15526 [42:46<4:04:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2314/15526 [42:47<4:04:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2314/15526 [42:47<4:04:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2315/15526 [42:49<4:04:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2315/15526 [42:49<4:04:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2316/15526 [42:50<4:04:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2316/15526 [42:50<4:04:20,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2317/15526 [42:51<4:04:17,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2317/15526 [42:51<4:04:17,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2318/15526 [42:52<4:04:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2318/15526 [42:52<4:04:16,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2319/15526 [42:53<4:04:16,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2319/15526 [42:53<4:04:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2320/15526 [42:54<4:04:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2320/15526 [42:54<4:04:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2321/15526 [42:54<4:04:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2321/15526 [42:54<4:04:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2322/15526 [42:55<4:04:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2322/15526 [42:55<4:04:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2323/15526 [42:56<4:04:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2323/15526 [42:56<4:04:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2324/15526 [42:57<4:04:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2324/15526 [42:57<4:04:01,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2325/15526 [42:58<4:03:58,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2325/15526 [42:58<4:03:58,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2326/15526 [42:59<4:03:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2326/15526 [42:59<4:03:57,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2327/15526 [43:00<4:03:54,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2327/15526 [43:00<4:03:54,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2328/15526 [43:00<4:03:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2328/15526 [43:00<4:03:50,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2329/15526 [43:01<4:03:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2329/15526 [43:01<4:03:50,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2330/15526 [43:02<4:03:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2330/15526 [43:02<4:03:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2331/15526 [43:03<4:03:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2331/15526 [43:03<4:03:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2332/15526 [43:04<4:03:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2332/15526 [43:04<4:03:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2333/15526 [43:04<4:03:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2333/15526 [43:04<4:03:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2334/15526 [43:05<4:03:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2334/15526 [43:05<4:03:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2335/15526 [43:06<4:03:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2335/15526 [43:06<4:03:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2336/15526 [43:13<4:04:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2336/15526 [43:13<4:04:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2337/15526 [43:14<4:04:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2337/15526 [43:14<4:04:00,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2338/15526 [43:14<4:03:57,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2338/15526 [43:14<4:03:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2339/15526 [43:16<4:03:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2339/15526 [43:16<4:03:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2340/15526 [43:16<4:03:53,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2340/15526 [43:16<4:03:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2341/15526 [43:17<4:03:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2341/15526 [43:17<4:03:50,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2342/15526 [43:18<4:03:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2342/15526 [43:18<4:03:49,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2343/15526 [43:20<4:03:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2343/15526 [43:20<4:03:49,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2344/15526 [43:20<4:03:45,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2344/15526 [43:20<4:03:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2345/15526 [43:21<4:03:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2345/15526 [43:21<4:03:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2346/15526 [43:22<4:03:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2346/15526 [43:22<4:03:42,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2347/15526 [43:23<4:03:38,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2347/15526 [43:23<4:03:38,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2348/15526 [43:24<4:03:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2348/15526 [43:24<4:03:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2349/15526 [43:24<4:03:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2349/15526 [43:24<4:03:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2350/15526 [43:25<4:03:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2350/15526 [43:25<4:03:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2351/15526 [43:26<4:03:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2351/15526 [43:26<4:03:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2352/15526 [43:27<4:03:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2352/15526 [43:27<4:03:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2353/15526 [43:28<4:03:23,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2353/15526 [43:28<4:03:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2354/15526 [43:29<4:03:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2354/15526 [43:29<4:03:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2355/15526 [43:29<4:03:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2355/15526 [43:29<4:03:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2356/15526 [43:30<4:03:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2356/15526 [43:30<4:03:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2357/15526 [43:31<4:03:11,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2357/15526 [43:31<4:03:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2358/15526 [43:32<4:03:07,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2358/15526 [43:32<4:03:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2359/15526 [43:32<4:03:04,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2359/15526 [43:32<4:03:04,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2360/15526 [43:34<4:03:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2360/15526 [43:34<4:03:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2361/15526 [43:35<4:03:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2361/15526 [43:35<4:03:02,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2362/15526 [43:35<4:02:59,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2362/15526 [43:35<4:02:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2363/15526 [43:36<4:02:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2363/15526 [43:36<4:02:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2364/15526 [43:37<4:02:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2364/15526 [43:37<4:02:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2365/15526 [43:38<4:02:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2365/15526 [43:38<4:02:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2366/15526 [43:39<4:02:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2366/15526 [43:39<4:02:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2367/15526 [43:40<4:02:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2367/15526 [43:40<4:02:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2368/15526 [43:46<4:03:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2368/15526 [43:46<4:03:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2369/15526 [43:47<4:03:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2369/15526 [43:47<4:03:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2370/15526 [43:47<4:03:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2370/15526 [43:47<4:03:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2371/15526 [43:48<4:03:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2371/15526 [43:48<4:03:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2372/15526 [43:50<4:03:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2372/15526 [43:50<4:03:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2373/15526 [43:51<4:03:04,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2373/15526 [43:51<4:03:04,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2374/15526 [43:52<4:03:01,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2374/15526 [43:52<4:03:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2375/15526 [43:52<4:02:58,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2375/15526 [43:52<4:02:58,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2376/15526 [43:53<4:02:54,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2376/15526 [43:53<4:02:54,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2377/15526 [43:54<4:02:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2377/15526 [43:54<4:02:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2378/15526 [43:55<4:02:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2378/15526 [43:55<4:02:51,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2379/15526 [43:56<4:02:47,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2379/15526 [43:56<4:02:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2380/15526 [43:57<4:02:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2380/15526 [43:57<4:02:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2381/15526 [43:57<4:02:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2381/15526 [43:57<4:02:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2382/15526 [43:59<4:02:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2382/15526 [43:59<4:02:43,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2383/15526 [43:59<4:02:39,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2383/15526 [43:59<4:02:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2384/15526 [44:00<4:02:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2384/15526 [44:00<4:02:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2385/15526 [44:01<4:02:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2385/15526 [44:01<4:02:35,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2386/15526 [44:02<4:02:32,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2386/15526 [44:02<4:02:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2387/15526 [44:03<4:02:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2387/15526 [44:03<4:02:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2388/15526 [44:04<4:02:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2388/15526 [44:04<4:02:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2389/15526 [44:05<4:02:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2389/15526 [44:05<4:02:27,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2390/15526 [44:06<4:02:27,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2390/15526 [44:06<4:02:27,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2391/15526 [44:07<4:02:26,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2391/15526 [44:07<4:02:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2392/15526 [44:08<4:02:23,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2392/15526 [44:08<4:02:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2393/15526 [44:09<4:02:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2393/15526 [44:09<4:02:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2394/15526 [44:10<4:02:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2394/15526 [44:10<4:02:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2395/15526 [44:10<4:02:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2395/15526 [44:10<4:02:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2396/15526 [44:11<4:02:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2396/15526 [44:11<4:02:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2397/15526 [44:12<4:02:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2397/15526 [44:12<4:02:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2398/15526 [44:13<4:02:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2398/15526 [44:13<4:02:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2399/15526 [44:14<4:02:04,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2399/15526 [44:14<4:02:04,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2400/15526 [44:20<4:02:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2400/15526 [44:20<4:02:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2401/15526 [44:44<4:04:36,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2401/15526 [44:44<4:04:36,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2402/15526 [44:46<4:04:36,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2402/15526 [44:46<4:04:36,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2403/15526 [44:47<4:04:35,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2403/15526 [44:47<4:04:35,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2404/15526 [44:47<4:04:32,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 2404/15526 [44:47<4:04:32,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2405/15526 [44:49<4:04:31,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2405/15526 [44:49<4:04:31,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 2406/15526 [44:49<4:04:27,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 2406/15526 [44:49<4:04:27,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2407/15526 [44:51<4:04:27,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2407/15526 [44:51<4:04:27,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2408/15526 [44:51<4:04:23,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2408/15526 [44:51<4:04:23,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2409/15526 [44:52<4:04:20,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2409/15526 [44:52<4:04:20,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2410/15526 [44:53<4:04:16,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2410/15526 [44:53<4:04:16,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2411/15526 [44:53<4:04:13,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2411/15526 [44:53<4:04:13,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2412/15526 [44:55<4:04:12,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2412/15526 [44:55<4:04:12,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2413/15526 [44:56<4:04:12,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 2413/15526 [44:56<4:04:12,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2414/15526 [44:56<4:04:08,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2414/15526 [44:56<4:04:08,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2415/15526 [44:57<4:04:05,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2415/15526 [44:57<4:04:05,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2416/15526 [44:58<4:04:01,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2416/15526 [44:58<4:04:01,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2417/15526 [44:58<4:03:58,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2417/15526 [44:58<4:03:58,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2418/15526 [44:59<4:03:54,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2418/15526 [44:59<4:03:54,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2419/15526 [45:00<4:03:54,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2419/15526 [45:00<4:03:54,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2420/15526 [45:01<4:03:50,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 2420/15526 [45:01<4:03:50,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2421/15526 [45:02<4:03:47,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2421/15526 [45:02<4:03:47,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2422/15526 [45:02<4:03:44,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2422/15526 [45:02<4:03:44,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2423/15526 [45:04<4:03:43,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2423/15526 [45:04<4:03:43,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2424/15526 [45:04<4:03:40,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 2424/15526 [45:04<4:03:40,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2425/15526 [45:05<4:03:36,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2425/15526 [45:05<4:03:36,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2426/15526 [45:06<4:03:33,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2426/15526 [45:06<4:03:33,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2427/15526 [45:07<4:03:32,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2427/15526 [45:07<4:03:32,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2428/15526 [45:08<4:03:31,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2428/15526 [45:08<4:03:31,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2429/15526 [45:09<4:03:31,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2429/15526 [45:09<4:03:31,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2430/15526 [45:11<4:03:30,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2430/15526 [45:11<4:03:30,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2431/15526 [45:11<4:03:27,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2431/15526 [45:11<4:03:27,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2432/15526 [45:19<4:04:00,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2432/15526 [45:19<4:04:00,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2433/15526 [45:19<4:03:56,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2433/15526 [45:19<4:03:56,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2434/15526 [45:20<4:03:53,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2434/15526 [45:20<4:03:53,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2435/15526 [45:21<4:03:52,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2435/15526 [45:21<4:03:52,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2436/15526 [45:22<4:03:52,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 2436/15526 [45:22<4:03:52,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2437/15526 [45:24<4:03:51,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2437/15526 [45:24<4:03:51,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2438/15526 [45:24<4:03:48,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 2438/15526 [45:24<4:03:48,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2439/15526 [45:26<4:03:47,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2439/15526 [45:26<4:03:47,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2440/15526 [45:27<4:03:46,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2440/15526 [45:27<4:03:46,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2441/15526 [45:27<4:03:43,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2441/15526 [45:27<4:03:43,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2442/15526 [45:29<4:03:42,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2442/15526 [45:29<4:03:42,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2443/15526 [45:29<4:03:39,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2443/15526 [45:29<4:03:39,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2444/15526 [45:31<4:03:38,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2444/15526 [45:31<4:03:38,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2445/15526 [45:31<4:03:34,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2445/15526 [45:31<4:03:34,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2446/15526 [45:32<4:03:31,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2446/15526 [45:32<4:03:31,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2447/15526 [45:33<4:03:28,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2447/15526 [45:33<4:03:28,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2448/15526 [45:34<4:03:27,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2448/15526 [45:34<4:03:27,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2449/15526 [45:34<4:03:24,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2449/15526 [45:34<4:03:24,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2450/15526 [45:35<4:03:20,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2450/15526 [45:35<4:03:20,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2451/15526 [45:36<4:03:20,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2451/15526 [45:36<4:03:20,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2452/15526 [45:37<4:03:16,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2452/15526 [45:37<4:03:16,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2453/15526 [45:38<4:03:13,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2453/15526 [45:38<4:03:13,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2454/15526 [45:38<4:03:09,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2454/15526 [45:38<4:03:09,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2455/15526 [45:40<4:03:09,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2455/15526 [45:40<4:03:09,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2456/15526 [45:40<4:03:05,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2456/15526 [45:40<4:03:05,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2457/15526 [45:41<4:03:02,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2457/15526 [45:41<4:03:02,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2458/15526 [45:42<4:03:01,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2458/15526 [45:42<4:03:01,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2459/15526 [45:43<4:02:58,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2459/15526 [45:43<4:02:58,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2460/15526 [45:44<4:02:57,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2460/15526 [45:44<4:02:57,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2461/15526 [45:45<4:02:57,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 2461/15526 [45:45<4:02:57,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2462/15526 [45:46<4:02:53,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2462/15526 [45:46<4:02:53,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2463/15526 [45:47<4:02:50,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2463/15526 [45:47<4:02:50,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2464/15526 [45:53<4:03:14,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2464/15526 [45:53<4:03:14,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2465/15526 [45:53<4:03:11,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2465/15526 [45:53<4:03:11,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2466/15526 [45:54<4:03:10,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2466/15526 [45:54<4:03:10,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2467/15526 [45:55<4:03:07,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 2467/15526 [45:55<4:03:07,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2468/15526 [45:56<4:03:03,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2468/15526 [45:56<4:03:03,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2469/15526 [45:57<4:03:00,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2469/15526 [45:57<4:03:00,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2470/15526 [45:57<4:02:56,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2470/15526 [45:57<4:02:56,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2471/15526 [45:58<4:02:53,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2471/15526 [45:58<4:02:53,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2472/15526 [45:59<4:02:50,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2472/15526 [45:59<4:02:50,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2473/15526 [45:59<4:02:46,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2473/15526 [45:59<4:02:46,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2474/15526 [46:00<4:02:45,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2474/15526 [46:00<4:02:45,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2475/15526 [46:01<4:02:42,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2475/15526 [46:01<4:02:42,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2476/15526 [46:02<4:02:41,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2476/15526 [46:02<4:02:41,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2477/15526 [46:04<4:02:41,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 2477/15526 [46:04<4:02:41,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2478/15526 [46:04<4:02:37,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 2478/15526 [46:04<4:02:37,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2479/15526 [46:05<4:02:34,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2479/15526 [46:05<4:02:34,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2480/15526 [46:06<4:02:33,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2480/15526 [46:06<4:02:33,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2481/15526 [46:07<4:02:32,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2481/15526 [46:07<4:02:32,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2482/15526 [46:08<4:02:29,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2482/15526 [46:08<4:02:29,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2483/15526 [46:09<4:02:26,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2483/15526 [46:09<4:02:26,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2484/15526 [46:09<4:02:22,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2484/15526 [46:09<4:02:22,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2485/15526 [46:10<4:02:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2485/15526 [46:10<4:02:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2486/15526 [46:11<4:02:18,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2486/15526 [46:11<4:02:18,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2487/15526 [46:12<4:02:18,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 2487/15526 [46:12<4:02:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2488/15526 [46:14<4:02:17,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2488/15526 [46:14<4:02:17,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2489/15526 [46:14<4:02:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2489/15526 [46:14<4:02:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2490/15526 [46:15<4:02:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2490/15526 [46:15<4:02:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2491/15526 [46:16<4:02:07,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2491/15526 [46:16<4:02:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2492/15526 [46:17<4:02:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2492/15526 [46:17<4:02:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2493/15526 [46:18<4:02:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2493/15526 [46:18<4:02:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2494/15526 [46:19<4:02:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2494/15526 [46:19<4:02:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2495/15526 [46:20<4:02:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2495/15526 [46:20<4:02:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2496/15526 [46:28<4:02:36,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2496/15526 [46:28<4:02:36,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2497/15526 [46:29<4:02:33,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 2497/15526 [46:29<4:02:33,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2498/15526 [46:29<4:02:29,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2498/15526 [46:29<4:02:29,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2499/15526 [46:30<4:02:26,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2499/15526 [46:30<4:02:26,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2500/15526 [46:31<4:02:25,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2500/15526 [46:31<4:02:25,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2501/15526 [46:32<4:02:22,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2501/15526 [46:32<4:02:22,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2502/15526 [46:33<4:02:19,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2502/15526 [46:33<4:02:19,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2503/15526 [46:33<4:02:16,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2503/15526 [46:33<4:02:16,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2504/15526 [46:35<4:02:15,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2504/15526 [46:35<4:02:15,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2505/15526 [46:36<4:02:15,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2505/15526 [46:36<4:02:15,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2506/15526 [46:37<4:02:14,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2506/15526 [46:37<4:02:14,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2507/15526 [46:38<4:02:11,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2507/15526 [46:38<4:02:11,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2508/15526 [46:38<4:02:07,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2508/15526 [46:38<4:02:07,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2509/15526 [46:40<4:02:07,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2509/15526 [46:40<4:02:07,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2510/15526 [46:40<4:02:03,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2510/15526 [46:40<4:02:03,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2511/15526 [46:42<4:02:03,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2511/15526 [46:42<4:02:03,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2512/15526 [46:43<4:02:02,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2512/15526 [46:43<4:02:02,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2513/15526 [46:44<4:02:02,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2513/15526 [46:44<4:02:02,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2514/15526 [46:45<4:02:01,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2514/15526 [46:45<4:02:01,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2515/15526 [46:46<4:01:58,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2515/15526 [46:46<4:01:58,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2516/15526 [46:47<4:01:57,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2516/15526 [46:47<4:01:57,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2517/15526 [46:48<4:01:57,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2517/15526 [46:48<4:01:57,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2518/15526 [46:49<4:01:54,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2518/15526 [46:49<4:01:54,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2519/15526 [46:50<4:01:50,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2519/15526 [46:50<4:01:50,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2520/15526 [46:50<4:01:47,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2520/15526 [46:50<4:01:47,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2521/15526 [46:52<4:01:46,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2521/15526 [46:52<4:01:46,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2522/15526 [46:52<4:01:43,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2522/15526 [46:52<4:01:43,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2523/15526 [46:53<4:01:40,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2523/15526 [46:53<4:01:40,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2524/15526 [46:54<4:01:39,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2524/15526 [46:54<4:01:39,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2525/15526 [46:55<4:01:36,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2525/15526 [46:55<4:01:36,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2526/15526 [46:56<4:01:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2526/15526 [46:56<4:01:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2527/15526 [46:56<4:01:29,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2527/15526 [46:56<4:01:29,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2528/15526 [47:02<4:01:53,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2528/15526 [47:02<4:01:53,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2529/15526 [47:03<4:01:50,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2529/15526 [47:03<4:01:50,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2530/15526 [47:04<4:01:46,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2530/15526 [47:04<4:01:46,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2531/15526 [47:04<4:01:43,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2531/15526 [47:04<4:01:43,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2532/15526 [47:05<4:01:40,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2532/15526 [47:05<4:01:40,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2533/15526 [47:06<4:01:39,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2533/15526 [47:06<4:01:39,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2534/15526 [47:07<4:01:36,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2534/15526 [47:07<4:01:36,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2535/15526 [47:08<4:01:33,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2535/15526 [47:08<4:01:33,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2536/15526 [47:08<4:01:29,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2536/15526 [47:08<4:01:29,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2537/15526 [47:10<4:01:29,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2537/15526 [47:10<4:01:29,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2538/15526 [47:11<4:01:28,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2538/15526 [47:11<4:01:28,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2539/15526 [47:11<4:01:25,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 2539/15526 [47:11<4:01:25,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2540/15526 [47:12<4:01:21,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2540/15526 [47:12<4:01:21,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2541/15526 [47:13<4:01:18,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2541/15526 [47:13<4:01:18,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2542/15526 [47:13<4:01:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2542/15526 [47:13<4:01:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2543/15526 [47:15<4:01:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2543/15526 [47:15<4:01:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2544/15526 [47:15<4:01:11,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2544/15526 [47:15<4:01:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2545/15526 [47:16<4:01:07,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2545/15526 [47:16<4:01:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2546/15526 [47:17<4:01:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2546/15526 [47:17<4:01:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2547/15526 [47:18<4:01:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2547/15526 [47:18<4:01:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2548/15526 [47:19<4:01:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2548/15526 [47:19<4:01:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2549/15526 [47:19<4:00:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2549/15526 [47:19<4:00:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2550/15526 [47:20<4:00:53,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2550/15526 [47:20<4:00:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2551/15526 [47:21<4:00:53,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2551/15526 [47:21<4:00:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2552/15526 [47:22<4:00:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2552/15526 [47:22<4:00:49,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2553/15526 [47:23<4:00:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2553/15526 [47:23<4:00:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2554/15526 [47:23<4:00:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2554/15526 [47:23<4:00:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2555/15526 [47:24<4:00:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2555/15526 [47:24<4:00:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2556/15526 [47:25<4:00:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2556/15526 [47:25<4:00:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2557/15526 [47:25<4:00:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2557/15526 [47:25<4:00:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2558/15526 [47:26<4:00:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2558/15526 [47:26<4:00:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2559/15526 [47:27<4:00:29,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2559/15526 [47:27<4:00:29,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2560/15526 [47:40<4:01:26,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2560/15526 [47:40<4:01:26,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 2561/15526 [47:40<4:01:23,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 2561/15526 [47:40<4:01:23,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2562/15526 [47:41<4:01:19,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2562/15526 [47:41<4:01:19,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2563/15526 [47:42<4:01:16,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2563/15526 [47:42<4:01:16,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2564/15526 [47:42<4:01:13,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2564/15526 [47:42<4:01:13,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2565/15526 [47:43<4:01:09,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2565/15526 [47:43<4:01:09,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2566/15526 [47:44<4:01:09,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2566/15526 [47:44<4:01:09,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2567/15526 [47:45<4:01:05,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2567/15526 [47:45<4:01:05,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2568/15526 [47:46<4:01:02,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2568/15526 [47:46<4:01:02,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2569/15526 [47:46<4:00:59,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2569/15526 [47:46<4:00:59,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2570/15526 [47:47<4:00:55,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2570/15526 [47:47<4:00:55,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2571/15526 [47:48<4:00:55,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2571/15526 [47:48<4:00:55,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2572/15526 [47:49<4:00:52,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 2572/15526 [47:49<4:00:52,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2573/15526 [47:50<4:00:48,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2573/15526 [47:50<4:00:48,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2574/15526 [47:50<4:00:45,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2574/15526 [47:50<4:00:45,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2575/15526 [47:52<4:00:45,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2575/15526 [47:52<4:00:45,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2576/15526 [47:52<4:00:41,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2576/15526 [47:52<4:00:41,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2577/15526 [47:53<4:00:41,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2577/15526 [47:53<4:00:41,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2578/15526 [47:55<4:00:40,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 2578/15526 [47:55<4:00:40,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2579/15526 [47:56<4:00:39,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2579/15526 [47:56<4:00:39,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2580/15526 [47:57<4:00:39,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2580/15526 [47:57<4:00:39,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2581/15526 [47:58<4:00:35,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 2581/15526 [47:58<4:00:35,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2582/15526 [47:58<4:00:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2582/15526 [47:58<4:00:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|��| 2583/15526 [47:59<4:00:29,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2583/15526 [47:59<4:00:29,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2584/15526 [48:00<4:00:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2584/15526 [48:00<4:00:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2585/15526 [48:01<4:00:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2585/15526 [48:01<4:00:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2586/15526 [48:02<4:00:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2586/15526 [48:02<4:00:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2587/15526 [48:02<4:00:18,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2587/15526 [48:02<4:00:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2588/15526 [48:03<4:00:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2588/15526 [48:03<4:00:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2589/15526 [48:04<4:00:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2589/15526 [48:04<4:00:14,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2590/15526 [48:05<4:00:13,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 2590/15526 [48:05<4:00:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2591/15526 [48:07<4:00:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2591/15526 [48:07<4:00:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2592/15526 [48:13<4:00:39,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2592/15526 [48:13<4:00:39,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2593/15526 [48:14<4:00:38,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2593/15526 [48:14<4:00:38,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2594/15526 [48:15<4:00:35,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2594/15526 [48:15<4:00:35,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2595/15526 [48:16<4:00:31,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2595/15526 [48:16<4:00:31,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2596/15526 [48:17<4:00:31,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2596/15526 [48:17<4:00:31,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2597/15526 [48:18<4:00:27,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2597/15526 [48:18<4:00:27,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2598/15526 [48:19<4:00:27,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2598/15526 [48:19<4:00:27,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2599/15526 [48:20<4:00:26,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2599/15526 [48:20<4:00:26,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2600/15526 [48:21<4:00:23,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2600/15526 [48:21<4:00:23,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2601/15526 [48:21<4:00:20,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2601/15526 [48:21<4:00:20,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2602/15526 [48:22<4:00:16,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2602/15526 [48:22<4:00:16,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2603/15526 [48:23<4:00:13,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2603/15526 [48:23<4:00:13,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2604/15526 [48:24<4:00:12,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2604/15526 [48:24<4:00:12,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2605/15526 [48:25<4:00:09,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2605/15526 [48:25<4:00:09,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2606/15526 [48:26<4:00:09,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2606/15526 [48:26<4:00:09,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2607/15526 [48:27<4:00:06,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2607/15526 [48:27<4:00:06,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2608/15526 [48:27<4:00:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2608/15526 [48:27<4:00:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2609/15526 [48:29<4:00:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2609/15526 [48:29<4:00:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2610/15526 [48:29<3:59:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2610/15526 [48:29<3:59:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2611/15526 [48:30<3:59:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2611/15526 [48:30<3:59:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2612/15526 [48:31<3:59:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2612/15526 [48:31<3:59:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2613/15526 [48:32<3:59:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2613/15526 [48:32<3:59:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2614/15526 [48:33<3:59:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2614/15526 [48:33<3:59:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2615/15526 [48:34<3:59:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2615/15526 [48:34<3:59:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2616/15526 [48:35<3:59:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2616/15526 [48:35<3:59:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2617/15526 [48:36<3:59:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2617/15526 [48:36<3:59:46,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2618/15526 [48:37<3:59:43,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 2618/15526 [48:37<3:59:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2619/15526 [48:38<3:59:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2619/15526 [48:38<3:59:42,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2620/15526 [48:39<3:59:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2620/15526 [48:39<3:59:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2621/15526 [48:39<3:59:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2621/15526 [48:39<3:59:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2622/15526 [48:40<3:59:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2622/15526 [48:40<3:59:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2623/15526 [48:41<3:59:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2623/15526 [48:41<3:59:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2624/15526 [48:47<3:59:54,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2624/15526 [48:47<3:59:54,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2625/15526 [48:48<3:59:51,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2625/15526 [48:48<3:59:51,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2626/15526 [48:48<3:59:48,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2626/15526 [48:48<3:59:48,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2627/15526 [48:50<3:59:47,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2627/15526 [48:50<3:59:47,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2628/15526 [48:50<3:59:44,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 2628/15526 [48:50<3:59:44,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2629/15526 [48:51<3:59:40,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2629/15526 [48:51<3:59:40,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2630/15526 [48:52<3:59:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2630/15526 [48:52<3:59:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2631/15526 [48:53<3:59:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2631/15526 [48:53<3:59:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2632/15526 [48:54<3:59:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2632/15526 [48:54<3:59:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2633/15526 [48:55<3:59:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2633/15526 [48:55<3:59:32,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2634/15526 [48:55<3:59:29,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 2634/15526 [48:55<3:59:29,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2635/15526 [48:57<3:59:28,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2635/15526 [48:57<3:59:28,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2636/15526 [48:57<3:59:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2636/15526 [48:57<3:59:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2637/15526 [48:58<3:59:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2637/15526 [48:58<3:59:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2638/15526 [48:59<3:59:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2638/15526 [48:59<3:59:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2639/15526 [48:59<3:59:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2639/15526 [48:59<3:59:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2640/15526 [49:00<3:59:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2640/15526 [49:00<3:59:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2641/15526 [49:01<3:59:11,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2641/15526 [49:01<3:59:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2642/15526 [49:02<3:59:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2642/15526 [49:02<3:59:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2643/15526 [49:02<3:59:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2643/15526 [49:02<3:59:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2644/15526 [49:03<3:59:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2644/15526 [49:03<3:59:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2645/15526 [49:04<3:59:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2645/15526 [49:04<3:59:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2646/15526 [49:05<3:58:58,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2646/15526 [49:05<3:58:58,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2647/15526 [49:06<3:58:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2647/15526 [49:06<3:58:57,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2648/15526 [49:07<3:58:54,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 2648/15526 [49:07<3:58:54,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2649/15526 [49:08<3:58:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2649/15526 [49:08<3:58:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2650/15526 [49:08<3:58:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2650/15526 [49:08<3:58:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2651/15526 [49:09<3:58:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2651/15526 [49:09<3:58:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2652/15526 [49:10<3:58:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2652/15526 [49:10<3:58:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2653/15526 [49:11<3:58:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2653/15526 [49:11<3:58:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2654/15526 [49:12<3:58:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2654/15526 [49:12<3:58:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2655/15526 [49:13<3:58:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2655/15526 [49:13<3:58:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2656/15526 [49:23<3:59:20,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2656/15526 [49:23<3:59:20,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2657/15526 [49:24<3:59:17,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2657/15526 [49:24<3:59:17,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2658/15526 [49:24<3:59:14,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2658/15526 [49:24<3:59:14,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2659/15526 [49:25<3:59:10,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2659/15526 [49:25<3:59:10,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2660/15526 [49:26<3:59:07,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2660/15526 [49:26<3:59:07,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2661/15526 [49:27<3:59:06,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2661/15526 [49:27<3:59:06,  1.12s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2662/15526 [49:28<3:59:03,  1.12s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 2662/15526 [49:28<3:59:03,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2663/15526 [49:28<3:59:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2663/15526 [49:28<3:59:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2664/15526 [49:30<3:58:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2664/15526 [49:30<3:58:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2665/15526 [49:31<3:58:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2665/15526 [49:31<3:58:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2666/15526 [49:32<3:58:58,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2666/15526 [49:32<3:58:58,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2667/15526 [49:33<3:58:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2667/15526 [49:33<3:58:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2668/15526 [49:34<3:58:54,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2668/15526 [49:34<3:58:54,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2669/15526 [49:34<3:58:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2669/15526 [49:34<3:58:50,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2670/15526 [49:35<3:58:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2670/15526 [49:35<3:58:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2671/15526 [49:36<3:58:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2671/15526 [49:36<3:58:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2672/15526 [49:38<3:58:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2672/15526 [49:38<3:58:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2673/15526 [49:39<3:58:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2673/15526 [49:39<3:58:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2674/15526 [49:39<3:58:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2674/15526 [49:39<3:58:42,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2675/15526 [49:40<3:58:38,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2675/15526 [49:40<3:58:38,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2676/15526 [49:41<3:58:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2676/15526 [49:41<3:58:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2677/15526 [49:41<3:58:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2677/15526 [49:41<3:58:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2678/15526 [49:42<3:58:29,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2678/15526 [49:42<3:58:29,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2679/15526 [49:43<3:58:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2679/15526 [49:43<3:58:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2680/15526 [49:44<3:58:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2680/15526 [49:44<3:58:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2681/15526 [49:45<3:58:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2681/15526 [49:45<3:58:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2682/15526 [49:45<3:58:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2682/15526 [49:45<3:58:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2683/15526 [49:47<3:58:18,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2683/15526 [49:47<3:58:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2684/15526 [49:47<3:58:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2684/15526 [49:47<3:58:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2685/15526 [49:48<3:58:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2685/15526 [49:48<3:58:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2686/15526 [49:49<3:58:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2686/15526 [49:49<3:58:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2687/15526 [49:49<3:58:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2687/15526 [49:49<3:58:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2688/15526 [49:57<3:58:37,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2688/15526 [49:57<3:58:37,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2689/15526 [49:58<3:58:34,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2689/15526 [49:58<3:58:34,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2690/15526 [49:59<3:58:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2690/15526 [49:59<3:58:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2691/15526 [49:59<3:58:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2691/15526 [49:59<3:58:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2692/15526 [50:00<3:58:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2692/15526 [50:00<3:58:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2693/15526 [50:01<3:58:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2693/15526 [50:01<3:58:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2694/15526 [50:02<3:58:23,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2694/15526 [50:02<3:58:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2695/15526 [50:03<3:58:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2695/15526 [50:03<3:58:20,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2696/15526 [50:04<3:58:17,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2696/15526 [50:04<3:58:17,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2697/15526 [50:04<3:58:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2697/15526 [50:04<3:58:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2698/15526 [50:06<3:58:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2698/15526 [50:06<3:58:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2699/15526 [50:06<3:58:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2699/15526 [50:06<3:58:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2700/15526 [50:08<3:58:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2700/15526 [50:08<3:58:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2701/15526 [50:08<3:58:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2701/15526 [50:08<3:58:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2702/15526 [50:09<3:58:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2702/15526 [50:09<3:58:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2703/15526 [50:10<3:58:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2703/15526 [50:10<3:58:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2704/15526 [50:11<3:57:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2704/15526 [50:11<3:57:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2705/15526 [50:12<3:57:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2705/15526 [50:12<3:57:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2706/15526 [50:12<3:57:53,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2706/15526 [50:12<3:57:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2707/15526 [50:13<3:57:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2707/15526 [50:13<3:57:50,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2708/15526 [50:14<3:57:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2708/15526 [50:14<3:57:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2709/15526 [50:15<3:57:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2709/15526 [50:15<3:57:46,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2710/15526 [50:16<3:57:43,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 2710/15526 [50:16<3:57:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2711/15526 [50:16<3:57:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2711/15526 [50:16<3:57:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2712/15526 [50:17<3:57:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2712/15526 [50:17<3:57:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2713/15526 [50:18<3:57:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2713/15526 [50:18<3:57:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2714/15526 [50:19<3:57:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2714/15526 [50:19<3:57:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2715/15526 [50:21<3:57:34,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2715/15526 [50:21<3:57:34,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2716/15526 [50:22<3:57:34,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2716/15526 [50:22<3:57:34,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 2717/15526 [50:22<3:57:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 2717/15526 [50:22<3:57:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2718/15526 [50:24<3:57:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2718/15526 [50:24<3:57:30,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2719/15526 [50:24<3:57:27,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 2719/15526 [50:24<3:57:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2720/15526 [50:32<3:57:58,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2720/15526 [50:32<3:57:58,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2721/15526 [50:33<3:57:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2721/15526 [50:33<3:57:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2722/15526 [50:34<3:57:53,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2722/15526 [50:34<3:57:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2723/15526 [50:35<3:57:52,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2723/15526 [50:35<3:57:52,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2724/15526 [50:36<3:57:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2724/15526 [50:36<3:57:49,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2725/15526 [50:37<3:57:48,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2725/15526 [50:37<3:57:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2726/15526 [50:38<3:57:48,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2726/15526 [50:38<3:57:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2727/15526 [50:39<3:57:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2727/15526 [50:39<3:57:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2728/15526 [50:41<3:57:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2728/15526 [50:41<3:57:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2729/15526 [50:41<3:57:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2729/15526 [50:41<3:57:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2730/15526 [50:42<3:57:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2730/15526 [50:42<3:57:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2731/15526 [50:43<3:57:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2731/15526 [50:43<3:57:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2732/15526 [50:44<3:57:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2732/15526 [50:44<3:57:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2733/15526 [50:45<3:57:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2733/15526 [50:45<3:57:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2734/15526 [50:46<3:57:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2734/15526 [50:46<3:57:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2735/15526 [50:47<3:57:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2735/15526 [50:47<3:57:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2736/15526 [50:48<3:57:28,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2736/15526 [50:48<3:57:28,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2737/15526 [50:48<3:57:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2737/15526 [50:48<3:57:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2738/15526 [50:49<3:57:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2738/15526 [50:49<3:57:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2739/15526 [50:50<3:57:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2739/15526 [50:50<3:57:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2740/15526 [50:51<3:57:18,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2740/15526 [50:51<3:57:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2741/15526 [50:51<3:57:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2741/15526 [50:51<3:57:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2742/15526 [50:52<3:57:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2742/15526 [50:52<3:57:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2743/15526 [50:53<3:57:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2743/15526 [50:53<3:57:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2744/15526 [50:54<3:57:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2744/15526 [50:54<3:57:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2745/15526 [50:54<3:57:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2745/15526 [50:54<3:57:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2746/15526 [50:55<3:56:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2746/15526 [50:55<3:56:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2747/15526 [50:56<3:56:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2747/15526 [50:56<3:56:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2748/15526 [50:56<3:56:53,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2748/15526 [50:56<3:56:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2749/15526 [50:57<3:56:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2749/15526 [50:57<3:56:50,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2750/15526 [50:58<3:56:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2750/15526 [50:58<3:56:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2751/15526 [50:59<3:56:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2751/15526 [50:59<3:56:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2752/15526 [51:05<3:57:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2752/15526 [51:05<3:57:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2753/15526 [51:07<3:57:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2753/15526 [51:07<3:57:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2754/15526 [51:08<3:57:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2754/15526 [51:08<3:57:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2755/15526 [51:08<3:57:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2755/15526 [51:08<3:57:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2756/15526 [51:09<3:57:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2756/15526 [51:09<3:57:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2757/15526 [51:10<3:57:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2757/15526 [51:10<3:57:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2758/15526 [51:11<3:57:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2758/15526 [51:11<3:57:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2759/15526 [51:13<3:57:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2759/15526 [51:13<3:57:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2760/15526 [51:14<3:57:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2760/15526 [51:14<3:57:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2761/15526 [51:15<3:56:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2761/15526 [51:15<3:56:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2762/15526 [51:16<3:56:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2762/15526 [51:16<3:56:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2763/15526 [51:16<3:56:52,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2763/15526 [51:16<3:56:52,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2764/15526 [51:17<3:56:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2764/15526 [51:17<3:56:49,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2765/15526 [51:18<3:56:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2765/15526 [51:18<3:56:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2766/15526 [51:18<3:56:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2766/15526 [51:18<3:56:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2767/15526 [51:19<3:56:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2767/15526 [51:19<3:56:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2768/15526 [51:20<3:56:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2768/15526 [51:20<3:56:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2769/15526 [51:20<3:56:34,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2769/15526 [51:20<3:56:34,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2770/15526 [51:21<3:56:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2770/15526 [51:21<3:56:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2771/15526 [51:22<3:56:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2771/15526 [51:22<3:56:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2772/15526 [51:23<3:56:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2772/15526 [51:23<3:56:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2773/15526 [51:24<3:56:23,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2773/15526 [51:24<3:56:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2774/15526 [51:24<3:56:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2774/15526 [51:24<3:56:20,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2775/15526 [51:25<3:56:17,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2775/15526 [51:25<3:56:17,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2776/15526 [51:26<3:56:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2776/15526 [51:26<3:56:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2777/15526 [51:27<3:56:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2777/15526 [51:27<3:56:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2778/15526 [51:28<3:56:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2778/15526 [51:28<3:56:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2779/15526 [51:29<3:56:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2779/15526 [51:29<3:56:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2780/15526 [51:30<3:56:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2780/15526 [51:30<3:56:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2781/15526 [51:31<3:56:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2781/15526 [51:31<3:56:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2782/15526 [51:32<3:56:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2782/15526 [51:32<3:56:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2783/15526 [51:32<3:56:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2783/15526 [51:32<3:56:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2784/15526 [51:39<3:56:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2784/15526 [51:39<3:56:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2785/15526 [51:40<3:56:23,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2785/15526 [51:40<3:56:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2786/15526 [51:41<3:56:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2786/15526 [51:41<3:56:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2787/15526 [51:42<3:56:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2787/15526 [51:42<3:56:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2788/15526 [51:42<3:56:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2788/15526 [51:42<3:56:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2789/15526 [51:44<3:56:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2789/15526 [51:44<3:56:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2790/15526 [51:44<3:56:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2790/15526 [51:44<3:56:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2791/15526 [51:45<3:56:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2791/15526 [51:45<3:56:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2792/15526 [51:46<3:56:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2792/15526 [51:46<3:56:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2793/15526 [51:47<3:56:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2793/15526 [51:47<3:56:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2794/15526 [51:48<3:56:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2794/15526 [51:48<3:56:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2795/15526 [51:49<3:56:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2795/15526 [51:49<3:56:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2796/15526 [51:50<3:56:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2796/15526 [51:50<3:56:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2797/15526 [51:51<3:55:58,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2797/15526 [51:51<3:55:58,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2798/15526 [51:51<3:55:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2798/15526 [51:51<3:55:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2799/15526 [51:52<3:55:52,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2799/15526 [51:52<3:55:52,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2800/15526 [51:53<3:55:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2800/15526 [51:53<3:55:49,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2801/15526 [51:53<3:55:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2801/15526 [51:53<3:55:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2802/15526 [51:54<3:55:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2802/15526 [51:54<3:55:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2803/15526 [51:55<3:55:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2803/15526 [51:55<3:55:42,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2804/15526 [51:56<3:55:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2804/15526 [51:56<3:55:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2805/15526 [51:57<3:55:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2805/15526 [51:57<3:55:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2806/15526 [51:57<3:55:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2806/15526 [51:57<3:55:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2807/15526 [51:58<3:55:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2807/15526 [51:58<3:55:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2808/15526 [51:59<3:55:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2808/15526 [51:59<3:55:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2809/15526 [51:59<3:55:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2809/15526 [51:59<3:55:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2810/15526 [52:00<3:55:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2810/15526 [52:00<3:55:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2811/15526 [52:01<3:55:17,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2811/15526 [52:01<3:55:17,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2812/15526 [52:02<3:55:17,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2812/15526 [52:02<3:55:17,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2813/15526 [52:03<3:55:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2813/15526 [52:03<3:55:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2814/15526 [52:03<3:55:11,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2814/15526 [52:03<3:55:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2815/15526 [52:04<3:55:07,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2815/15526 [52:04<3:55:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2816/15526 [52:13<3:55:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2816/15526 [52:13<3:55:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2817/15526 [52:15<3:55:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2817/15526 [52:15<3:55:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2818/15526 [52:15<3:55:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2818/15526 [52:15<3:55:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2819/15526 [52:16<3:55:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2819/15526 [52:16<3:55:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2820/15526 [52:17<3:55:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2820/15526 [52:17<3:55:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2821/15526 [52:18<3:55:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2821/15526 [52:18<3:55:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2822/15526 [52:19<3:55:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2822/15526 [52:19<3:55:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2823/15526 [52:20<3:55:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2823/15526 [52:20<3:55:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2824/15526 [52:21<3:55:29,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2824/15526 [52:21<3:55:29,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2825/15526 [52:22<3:55:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2825/15526 [52:22<3:55:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2826/15526 [52:22<3:55:23,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2826/15526 [52:22<3:55:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2827/15526 [52:24<3:55:23,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2827/15526 [52:24<3:55:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2828/15526 [52:24<3:55:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2828/15526 [52:24<3:55:20,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2829/15526 [52:25<3:55:17,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2829/15526 [52:25<3:55:17,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2830/15526 [52:26<3:55:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2830/15526 [52:26<3:55:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2831/15526 [52:26<3:55:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2831/15526 [52:26<3:55:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2832/15526 [52:27<3:55:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2832/15526 [52:27<3:55:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2833/15526 [52:28<3:55:07,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2833/15526 [52:28<3:55:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2834/15526 [52:29<3:55:04,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2834/15526 [52:29<3:55:04,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2835/15526 [52:30<3:55:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2835/15526 [52:30<3:55:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2836/15526 [52:31<3:55:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2836/15526 [52:31<3:55:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2837/15526 [52:31<3:54:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2837/15526 [52:31<3:54:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2838/15526 [52:33<3:54:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2838/15526 [52:33<3:54:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2839/15526 [52:34<3:54:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2839/15526 [52:34<3:54:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2840/15526 [52:35<3:54:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2840/15526 [52:35<3:54:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2841/15526 [52:36<3:54:54,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2841/15526 [52:36<3:54:54,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2842/15526 [52:37<3:54:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2842/15526 [52:37<3:54:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2843/15526 [52:38<3:54:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2843/15526 [52:38<3:54:50,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2844/15526 [52:39<3:54:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2844/15526 [52:39<3:54:50,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2845/15526 [52:41<3:54:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2845/15526 [52:41<3:54:49,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2846/15526 [52:41<3:54:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2846/15526 [52:41<3:54:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2847/15526 [52:42<3:54:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2847/15526 [52:42<3:54:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2848/15526 [52:49<3:55:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2848/15526 [52:49<3:55:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2849/15526 [52:50<3:55:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2849/15526 [52:50<3:55:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2850/15526 [52:50<3:55:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2850/15526 [52:50<3:55:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2851/15526 [52:51<3:54:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2851/15526 [52:51<3:54:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2852/15526 [52:52<3:54:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2852/15526 [52:52<3:54:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2853/15526 [52:52<3:54:53,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2853/15526 [52:52<3:54:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2854/15526 [52:53<3:54:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2854/15526 [52:53<3:54:50,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2855/15526 [52:54<3:54:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2855/15526 [52:54<3:54:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2856/15526 [52:54<3:54:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2856/15526 [52:54<3:54:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2857/15526 [52:55<3:54:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2857/15526 [52:55<3:54:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2858/15526 [52:56<3:54:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2858/15526 [52:56<3:54:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2859/15526 [52:57<3:54:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2859/15526 [52:57<3:54:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2860/15526 [52:58<3:54:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2860/15526 [52:58<3:54:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2861/15526 [52:59<3:54:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2861/15526 [52:59<3:54:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2862/15526 [53:00<3:54:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2862/15526 [53:00<3:54:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2863/15526 [53:01<3:54:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2863/15526 [53:01<3:54:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2864/15526 [53:02<3:54:29,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2864/15526 [53:02<3:54:29,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2865/15526 [53:03<3:54:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2865/15526 [53:03<3:54:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2866/15526 [53:04<3:54:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2866/15526 [53:04<3:54:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2867/15526 [53:04<3:54:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2867/15526 [53:04<3:54:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2868/15526 [53:06<3:54:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2868/15526 [53:06<3:54:21,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2869/15526 [53:06<3:54:18,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 2869/15526 [53:06<3:54:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2870/15526 [53:07<3:54:18,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2870/15526 [53:07<3:54:18,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2871/15526 [53:08<3:54:15,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 2871/15526 [53:08<3:54:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 2872/15526 [53:09<3:54:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 2872/15526 [53:09<3:54:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2873/15526 [53:10<3:54:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2873/15526 [53:10<3:54:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2874/15526 [53:11<3:54:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2874/15526 [53:11<3:54:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2875/15526 [53:11<3:54:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2875/15526 [53:11<3:54:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2876/15526 [53:12<3:54:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2876/15526 [53:12<3:54:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2877/15526 [53:13<3:53:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2877/15526 [53:13<3:53:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2878/15526 [53:13<3:53:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2878/15526 [53:13<3:53:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2879/15526 [53:14<3:53:53,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2879/15526 [53:14<3:53:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2880/15526 [53:23<3:54:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2880/15526 [53:23<3:54:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2881/15526 [53:24<3:54:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2881/15526 [53:24<3:54:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2882/15526 [53:25<3:54:23,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2882/15526 [53:25<3:54:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2883/15526 [53:26<3:54:23,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2883/15526 [53:26<3:54:23,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2884/15526 [53:28<3:54:22,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  19%|▏| 2884/15526 [53:28<3:54:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2885/15526 [53:29<3:54:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2885/15526 [53:29<3:54:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2886/15526 [53:30<3:54:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2886/15526 [53:30<3:54:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2887/15526 [53:31<3:54:18,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2887/15526 [53:31<3:54:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2888/15526 [53:32<3:54:17,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2888/15526 [53:32<3:54:17,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2889/15526 [53:33<3:54:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2889/15526 [53:33<3:54:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2890/15526 [53:34<3:54:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2890/15526 [53:34<3:54:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2891/15526 [53:35<3:54:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2891/15526 [53:35<3:54:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2892/15526 [53:36<3:54:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2892/15526 [53:36<3:54:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2893/15526 [53:36<3:54:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2893/15526 [53:36<3:54:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2894/15526 [53:37<3:54:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2894/15526 [53:37<3:54:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2895/15526 [53:39<3:54:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2895/15526 [53:39<3:54:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2896/15526 [53:39<3:54:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2896/15526 [53:39<3:54:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2897/15526 [53:40<3:53:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2897/15526 [53:40<3:53:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2898/15526 [53:41<3:53:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2898/15526 [53:41<3:53:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2899/15526 [53:41<3:53:52,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2899/15526 [53:41<3:53:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2900/15526 [53:42<3:53:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2900/15526 [53:42<3:53:49,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2901/15526 [53:43<3:53:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2901/15526 [53:43<3:53:49,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2902/15526 [53:44<3:53:48,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2902/15526 [53:44<3:53:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2903/15526 [53:46<3:53:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2903/15526 [53:46<3:53:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2904/15526 [53:46<3:53:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2904/15526 [53:46<3:53:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2905/15526 [53:47<3:53:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2905/15526 [53:47<3:53:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2906/15526 [53:48<3:53:38,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2906/15526 [53:48<3:53:38,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2907/15526 [53:48<3:53:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2907/15526 [53:48<3:53:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2908/15526 [53:49<3:53:34,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2908/15526 [53:49<3:53:34,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2909/15526 [53:50<3:53:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2909/15526 [53:50<3:53:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2910/15526 [53:51<3:53:28,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2910/15526 [53:51<3:53:28,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2911/15526 [53:51<3:53:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2911/15526 [53:51<3:53:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2912/15526 [53:57<3:53:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2912/15526 [53:57<3:53:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2913/15526 [53:59<3:53:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2913/15526 [53:59<3:53:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2914/15526 [53:59<3:53:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2914/15526 [53:59<3:53:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2915/15526 [54:00<3:53:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2915/15526 [54:00<3:53:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2916/15526 [54:01<3:53:38,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2916/15526 [54:01<3:53:38,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2917/15526 [54:02<3:53:34,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2917/15526 [54:02<3:53:34,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2918/15526 [54:02<3:53:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2918/15526 [54:02<3:53:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2919/15526 [54:03<3:53:28,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2919/15526 [54:03<3:53:28,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2920/15526 [54:04<3:53:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2920/15526 [54:04<3:53:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2921/15526 [54:04<3:53:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2921/15526 [54:04<3:53:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2922/15526 [54:05<3:53:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2922/15526 [54:05<3:53:20,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2923/15526 [54:06<3:53:17,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2923/15526 [54:06<3:53:17,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2924/15526 [54:07<3:53:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2924/15526 [54:07<3:53:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2925/15526 [54:08<3:53:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2925/15526 [54:08<3:53:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2926/15526 [54:08<3:53:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2926/15526 [54:08<3:53:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2927/15526 [54:09<3:53:07,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2927/15526 [54:09<3:53:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2928/15526 [54:10<3:53:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2928/15526 [54:10<3:53:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2929/15526 [54:11<3:53:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2929/15526 [54:11<3:53:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2930/15526 [54:12<3:53:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2930/15526 [54:12<3:53:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2931/15526 [54:13<3:53:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2931/15526 [54:13<3:53:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2932/15526 [54:14<3:52:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2932/15526 [54:14<3:52:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2933/15526 [54:14<3:52:54,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2933/15526 [54:14<3:52:54,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2934/15526 [54:15<3:52:53,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2934/15526 [54:15<3:52:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2935/15526 [54:17<3:52:52,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2935/15526 [54:17<3:52:52,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2936/15526 [54:17<3:52:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2936/15526 [54:17<3:52:49,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2937/15526 [54:18<3:52:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2937/15526 [54:18<3:52:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2938/15526 [54:19<3:52:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2938/15526 [54:19<3:52:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2939/15526 [54:19<3:52:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2939/15526 [54:19<3:52:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2940/15526 [54:20<3:52:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2940/15526 [54:20<3:52:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2941/15526 [54:21<3:52:34,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2941/15526 [54:21<3:52:34,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2942/15526 [54:21<3:52:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2942/15526 [54:21<3:52:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2943/15526 [54:23<3:52:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2943/15526 [54:23<3:52:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2944/15526 [54:32<3:53:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2944/15526 [54:32<3:53:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2945/15526 [54:33<3:53:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2945/15526 [54:33<3:53:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2946/15526 [54:33<3:53:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2946/15526 [54:33<3:53:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2947/15526 [54:35<3:52:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2947/15526 [54:35<3:52:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2948/15526 [54:36<3:52:58,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2948/15526 [54:36<3:52:58,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2949/15526 [54:36<3:52:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2949/15526 [54:36<3:52:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2950/15526 [54:37<3:52:52,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2950/15526 [54:37<3:52:52,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2951/15526 [54:38<3:52:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2951/15526 [54:38<3:52:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2952/15526 [54:39<3:52:48,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2952/15526 [54:39<3:52:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2953/15526 [54:40<3:52:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2953/15526 [54:40<3:52:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2954/15526 [54:40<3:52:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2954/15526 [54:40<3:52:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2955/15526 [54:41<3:52:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2955/15526 [54:41<3:52:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2956/15526 [54:42<3:52:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2956/15526 [54:42<3:52:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2957/15526 [54:42<3:52:34,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2957/15526 [54:42<3:52:34,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2958/15526 [54:43<3:52:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2958/15526 [54:43<3:52:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2959/15526 [54:44<3:52:28,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2959/15526 [54:44<3:52:28,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2960/15526 [54:45<3:52:28,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2960/15526 [54:45<3:52:28,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2961/15526 [54:46<3:52:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2961/15526 [54:46<3:52:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2962/15526 [54:46<3:52:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2962/15526 [54:46<3:52:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2963/15526 [54:47<3:52:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2963/15526 [54:47<3:52:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2964/15526 [54:48<3:52:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2964/15526 [54:48<3:52:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2965/15526 [54:49<3:52:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2965/15526 [54:49<3:52:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2966/15526 [54:50<3:52:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2966/15526 [54:50<3:52:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2967/15526 [54:51<3:52:11,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2967/15526 [54:51<3:52:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2968/15526 [54:51<3:52:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2968/15526 [54:51<3:52:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2969/15526 [54:52<3:52:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2969/15526 [54:52<3:52:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2970/15526 [54:53<3:52:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2970/15526 [54:53<3:52:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2971/15526 [54:54<3:52:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2971/15526 [54:54<3:52:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2972/15526 [54:55<3:51:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2972/15526 [54:55<3:51:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2973/15526 [54:55<3:51:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2973/15526 [54:55<3:51:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2974/15526 [54:57<3:51:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2974/15526 [54:57<3:51:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2975/15526 [54:57<3:51:52,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2975/15526 [54:57<3:51:52,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2976/15526 [55:06<3:52:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2976/15526 [55:06<3:52:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2977/15526 [55:07<3:52:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2977/15526 [55:07<3:52:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2978/15526 [55:08<3:52:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2978/15526 [55:08<3:52:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2979/15526 [55:09<3:52:18,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2979/15526 [55:09<3:52:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2980/15526 [55:10<3:52:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2980/15526 [55:10<3:52:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2981/15526 [55:10<3:52:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2981/15526 [55:10<3:52:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2982/15526 [55:11<3:52:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2982/15526 [55:11<3:52:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2983/15526 [55:13<3:52:11,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2983/15526 [55:13<3:52:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2984/15526 [55:13<3:52:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2984/15526 [55:13<3:52:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2985/15526 [55:15<3:52:07,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2985/15526 [55:15<3:52:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2986/15526 [55:15<3:52:04,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2986/15526 [55:15<3:52:04,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2987/15526 [55:16<3:52:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2987/15526 [55:16<3:52:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2988/15526 [55:17<3:52:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2988/15526 [55:17<3:52:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2989/15526 [55:18<3:51:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2989/15526 [55:18<3:51:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2990/15526 [55:18<3:51:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2990/15526 [55:18<3:51:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2991/15526 [55:20<3:51:54,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2991/15526 [55:20<3:51:54,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2992/15526 [55:20<3:51:51,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  19%|▏| 2992/15526 [55:20<3:51:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2993/15526 [55:21<3:51:48,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2993/15526 [55:21<3:51:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2994/15526 [55:22<3:51:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2994/15526 [55:22<3:51:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2995/15526 [55:23<3:51:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2995/15526 [55:23<3:51:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2996/15526 [55:24<3:51:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2996/15526 [55:24<3:51:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2997/15526 [55:24<3:51:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2997/15526 [55:24<3:51:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2998/15526 [55:25<3:51:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2998/15526 [55:25<3:51:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 2999/15526 [55:26<3:51:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 2999/15526 [55:26<3:51:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3000/15526 [55:27<3:51:34,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3000/15526 [55:27<3:51:34,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3001/15526 [55:28<3:51:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3001/15526 [55:28<3:51:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3002/15526 [55:29<3:51:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3002/15526 [55:29<3:51:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3003/15526 [55:31<3:51:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3003/15526 [55:31<3:51:30,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3004/15526 [55:31<3:51:28,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  19%|▏| 3004/15526 [55:31<3:51:28,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3005/15526 [55:32<3:51:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3005/15526 [55:32<3:51:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3006/15526 [55:33<3:51:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3006/15526 [55:33<3:51:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3007/15526 [55:33<3:51:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3007/15526 [55:33<3:51:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3008/15526 [55:40<3:51:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3008/15526 [55:40<3:51:43,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3009/15526 [55:41<3:51:40,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  19%|▏| 3009/15526 [55:41<3:51:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3010/15526 [55:42<3:51:37,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3010/15526 [55:42<3:51:37,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3011/15526 [55:43<3:51:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3011/15526 [55:43<3:51:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3012/15526 [55:44<3:51:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3012/15526 [55:44<3:51:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3013/15526 [55:44<3:51:31,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3013/15526 [55:44<3:51:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3014/15526 [55:45<3:51:28,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3014/15526 [55:45<3:51:28,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3015/15526 [55:46<3:51:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3015/15526 [55:46<3:51:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3016/15526 [55:46<3:51:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3016/15526 [55:46<3:51:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3017/15526 [55:48<3:51:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3017/15526 [55:48<3:51:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3018/15526 [55:48<3:51:18,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3018/15526 [55:48<3:51:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3019/15526 [55:49<3:51:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3019/15526 [55:49<3:51:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3020/15526 [55:50<3:51:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3020/15526 [55:50<3:51:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3021/15526 [55:51<3:51:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3021/15526 [55:51<3:51:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3022/15526 [55:51<3:51:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3022/15526 [55:51<3:51:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3023/15526 [55:52<3:51:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3023/15526 [55:52<3:51:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3024/15526 [55:53<3:51:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3024/15526 [55:53<3:51:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3025/15526 [55:53<3:51:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3025/15526 [55:53<3:51:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3026/15526 [55:54<3:50:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3026/15526 [55:54<3:50:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 3027/15526 [55:55<3:50:54,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 3027/15526 [55:55<3:50:54,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3028/15526 [55:56<3:50:54,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3028/15526 [55:56<3:50:54,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3029/15526 [55:57<3:50:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3029/15526 [55:57<3:50:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3030/15526 [55:57<3:50:48,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3030/15526 [55:57<3:50:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3031/15526 [55:58<3:50:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3031/15526 [55:58<3:50:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3032/15526 [55:59<3:50:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3032/15526 [55:59<3:50:42,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3033/15526 [55:59<3:50:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3033/15526 [55:59<3:50:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3034/15526 [56:00<3:50:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3034/15526 [56:00<3:50:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3035/15526 [56:01<3:50:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3035/15526 [56:01<3:50:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3036/15526 [56:01<3:50:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3036/15526 [56:01<3:50:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3037/15526 [56:02<3:50:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3037/15526 [56:02<3:50:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3038/15526 [56:03<3:50:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3038/15526 [56:03<3:50:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3039/15526 [56:04<3:50:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3039/15526 [56:04<3:50:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3040/15526 [56:15<3:51:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3040/15526 [56:15<3:51:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3041/15526 [56:16<3:51:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3041/15526 [56:16<3:51:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3042/15526 [56:17<3:50:59,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3042/15526 [56:17<3:50:59,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3043/15526 [56:17<3:50:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3043/15526 [56:17<3:50:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3044/15526 [56:18<3:50:54,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3044/15526 [56:18<3:50:54,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3045/15526 [56:19<3:50:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3045/15526 [56:19<3:50:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3046/15526 [56:20<3:50:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3046/15526 [56:20<3:50:50,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3047/15526 [56:21<3:50:47,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 3047/15526 [56:21<3:50:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3048/15526 [56:21<3:50:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3048/15526 [56:21<3:50:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3049/15526 [56:23<3:50:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3049/15526 [56:23<3:50:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3050/15526 [56:23<3:50:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3050/15526 [56:23<3:50:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3051/15526 [56:24<3:50:38,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3051/15526 [56:24<3:50:38,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3052/15526 [56:25<3:50:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3052/15526 [56:25<3:50:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3053/15526 [56:26<3:50:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3053/15526 [56:26<3:50:35,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3054/15526 [56:27<3:50:34,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 3054/15526 [56:27<3:50:34,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3055/15526 [56:28<3:50:31,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 3055/15526 [56:28<3:50:31,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3056/15526 [56:28<3:50:28,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3056/15526 [56:28<3:50:28,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3057/15526 [56:29<3:50:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3057/15526 [56:29<3:50:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3058/15526 [56:30<3:50:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3058/15526 [56:30<3:50:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3059/15526 [56:30<3:50:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3059/15526 [56:30<3:50:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3060/15526 [56:32<3:50:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3060/15526 [56:32<3:50:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3061/15526 [56:33<3:50:18,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3061/15526 [56:33<3:50:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3062/15526 [56:34<3:50:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3062/15526 [56:34<3:50:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3063/15526 [56:35<3:50:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3063/15526 [56:35<3:50:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3064/15526 [56:36<3:50:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3064/15526 [56:36<3:50:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3065/15526 [56:37<3:50:11,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3065/15526 [56:37<3:50:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3066/15526 [56:38<3:50:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3066/15526 [56:38<3:50:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3067/15526 [56:39<3:50:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3067/15526 [56:39<3:50:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3068/15526 [56:40<3:50:07,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3068/15526 [56:40<3:50:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3069/15526 [56:41<3:50:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3069/15526 [56:41<3:50:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3070/15526 [56:42<3:50:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3070/15526 [56:42<3:50:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3071/15526 [56:43<3:50:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3071/15526 [56:43<3:50:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3072/15526 [56:51<3:50:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3072/15526 [56:51<3:50:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3073/15526 [56:52<3:50:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3073/15526 [56:52<3:50:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3074/15526 [56:52<3:50:25,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3074/15526 [56:52<3:50:25,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3075/15526 [56:53<3:50:22,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3075/15526 [56:53<3:50:22,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3076/15526 [56:54<3:50:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3076/15526 [56:54<3:50:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3077/15526 [56:55<3:50:18,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3077/15526 [56:55<3:50:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3078/15526 [56:56<3:50:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3078/15526 [56:56<3:50:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3079/15526 [56:57<3:50:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3079/15526 [56:57<3:50:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3080/15526 [56:58<3:50:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3080/15526 [56:58<3:50:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3081/15526 [56:59<3:50:11,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3081/15526 [56:59<3:50:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3082/15526 [57:00<3:50:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3082/15526 [57:00<3:50:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3083/15526 [57:00<3:50:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3083/15526 [57:00<3:50:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3084/15526 [57:01<3:50:05,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3084/15526 [57:01<3:50:05,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3085/15526 [57:02<3:50:02,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3085/15526 [57:02<3:50:02,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3086/15526 [57:03<3:50:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3086/15526 [57:03<3:50:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3087/15526 [57:05<3:50:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3087/15526 [57:05<3:50:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3088/15526 [57:05<3:49:58,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3088/15526 [57:05<3:49:58,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3089/15526 [57:06<3:49:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3089/15526 [57:06<3:49:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3090/15526 [57:07<3:49:54,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3090/15526 [57:07<3:49:54,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3091/15526 [57:08<3:49:54,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3091/15526 [57:08<3:49:54,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3092/15526 [57:09<3:49:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3092/15526 [57:09<3:49:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3093/15526 [57:10<3:49:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3093/15526 [57:10<3:49:50,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3094/15526 [57:11<3:49:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3094/15526 [57:11<3:49:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3095/15526 [57:12<3:49:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3095/15526 [57:12<3:49:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3096/15526 [57:13<3:49:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3096/15526 [57:13<3:49:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3097/15526 [57:13<3:49:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3097/15526 [57:13<3:49:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3098/15526 [57:15<3:49:40,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3098/15526 [57:15<3:49:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3099/15526 [57:16<3:49:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3099/15526 [57:16<3:49:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3100/15526 [57:17<3:49:38,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3100/15526 [57:17<3:49:38,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3101/15526 [57:18<3:49:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3101/15526 [57:18<3:49:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3102/15526 [57:18<3:49:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3102/15526 [57:18<3:49:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3103/15526 [57:19<3:49:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3103/15526 [57:19<3:49:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3104/15526 [57:25<3:49:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3104/15526 [57:25<3:49:50,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3105/15526 [57:26<3:49:47,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3105/15526 [57:26<3:49:47,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3106/15526 [57:27<3:49:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3106/15526 [57:27<3:49:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3107/15526 [57:28<3:49:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3107/15526 [57:28<3:49:42,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3108/15526 [57:29<3:49:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3108/15526 [57:29<3:49:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3109/15526 [57:29<3:49:38,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3109/15526 [57:29<3:49:38,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3110/15526 [57:30<3:49:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3110/15526 [57:30<3:49:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3111/15526 [57:31<3:49:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3111/15526 [57:31<3:49:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3112/15526 [57:31<3:49:29,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3112/15526 [57:31<3:49:29,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3113/15526 [57:32<3:49:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3113/15526 [57:32<3:49:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3114/15526 [57:33<3:49:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3114/15526 [57:33<3:49:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3115/15526 [57:34<3:49:23,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3115/15526 [57:34<3:49:23,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3116/15526 [57:35<3:49:21,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 3116/15526 [57:35<3:49:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3117/15526 [57:35<3:49:18,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3117/15526 [57:35<3:49:18,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3118/15526 [57:36<3:49:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3118/15526 [57:36<3:49:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3119/15526 [57:37<3:49:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3119/15526 [57:37<3:49:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3120/15526 [57:37<3:49:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3120/15526 [57:37<3:49:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3121/15526 [57:38<3:49:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3121/15526 [57:38<3:49:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3122/15526 [57:39<3:49:04,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3122/15526 [57:39<3:49:04,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3123/15526 [57:39<3:49:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3123/15526 [57:39<3:49:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3124/15526 [57:40<3:48:58,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3124/15526 [57:40<3:48:58,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3125/15526 [57:41<3:48:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3125/15526 [57:41<3:48:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3126/15526 [57:42<3:48:54,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3126/15526 [57:42<3:48:54,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3127/15526 [57:43<3:48:54,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3127/15526 [57:43<3:48:54,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3128/15526 [57:44<3:48:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3128/15526 [57:44<3:48:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3129/15526 [57:45<3:48:48,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3129/15526 [57:45<3:48:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3130/15526 [57:45<3:48:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3130/15526 [57:45<3:48:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3131/15526 [57:46<3:48:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3131/15526 [57:46<3:48:42,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3132/15526 [57:47<3:48:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3132/15526 [57:47<3:48:40,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3133/15526 [57:48<3:48:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3133/15526 [57:48<3:48:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3134/15526 [57:48<3:48:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3134/15526 [57:48<3:48:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3135/15526 [57:49<3:48:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3135/15526 [57:49<3:48:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3136/15526 [58:00<3:49:11,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3136/15526 [58:00<3:49:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3137/15526 [58:01<3:49:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3137/15526 [58:01<3:49:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3138/15526 [58:02<3:49:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3138/15526 [58:02<3:49:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3139/15526 [58:03<3:49:07,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3139/15526 [58:03<3:49:07,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3140/15526 [58:05<3:49:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3140/15526 [58:05<3:49:06,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3141/15526 [58:06<3:49:06,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 3141/15526 [58:06<3:49:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3142/15526 [58:06<3:49:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3142/15526 [58:06<3:49:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3143/15526 [58:07<3:49:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3143/15526 [58:07<3:49:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3144/15526 [58:08<3:48:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3144/15526 [58:08<3:48:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3145/15526 [58:08<3:48:55,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3145/15526 [58:08<3:48:55,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3146/15526 [58:09<3:48:52,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3146/15526 [58:09<3:48:52,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3147/15526 [58:10<3:48:49,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3147/15526 [58:10<3:48:49,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3148/15526 [58:10<3:48:46,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3148/15526 [58:10<3:48:46,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3149/15526 [58:12<3:48:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3149/15526 [58:12<3:48:45,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3150/15526 [58:13<3:48:45,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 3150/15526 [58:13<3:48:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3151/15526 [58:14<3:48:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3151/15526 [58:14<3:48:42,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3152/15526 [58:14<3:48:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3152/15526 [58:14<3:48:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3153/15526 [58:15<3:48:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3153/15526 [58:15<3:48:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3154/15526 [58:16<3:48:34,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3154/15526 [58:16<3:48:34,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3155/15526 [58:17<3:48:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3155/15526 [58:17<3:48:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3156/15526 [58:18<3:48:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3156/15526 [58:18<3:48:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3157/15526 [58:19<3:48:29,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3157/15526 [58:19<3:48:29,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3158/15526 [58:20<3:48:28,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3158/15526 [58:20<3:48:28,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3159/15526 [58:21<3:48:26,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3159/15526 [58:21<3:48:26,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3160/15526 [58:21<3:48:23,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3160/15526 [58:21<3:48:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3161/15526 [58:22<3:48:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3161/15526 [58:22<3:48:20,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3162/15526 [58:23<3:48:17,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3162/15526 [58:23<3:48:17,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3163/15526 [58:23<3:48:15,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3163/15526 [58:23<3:48:15,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3164/15526 [58:25<3:48:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3164/15526 [58:25<3:48:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3165/15526 [58:25<3:48:11,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3165/15526 [58:25<3:48:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3166/15526 [58:26<3:48:11,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3166/15526 [58:26<3:48:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3167/15526 [58:27<3:48:08,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3167/15526 [58:27<3:48:08,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3168/15526 [58:35<3:48:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3168/15526 [58:35<3:48:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3169/15526 [58:36<3:48:30,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3169/15526 [58:36<3:48:30,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3170/15526 [58:36<3:48:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3170/15526 [58:36<3:48:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3171/15526 [58:37<3:48:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3171/15526 [58:37<3:48:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3172/15526 [58:38<3:48:21,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3172/15526 [58:38<3:48:21,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3173/15526 [58:38<3:48:19,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3173/15526 [58:38<3:48:19,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3174/15526 [58:39<3:48:16,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3174/15526 [58:39<3:48:16,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3175/15526 [58:40<3:48:13,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3175/15526 [58:40<3:48:13,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3176/15526 [58:40<3:48:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3176/15526 [58:40<3:48:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3177/15526 [58:42<3:48:10,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3177/15526 [58:42<3:48:10,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3178/15526 [58:43<3:48:09,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3178/15526 [58:43<3:48:09,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3179/15526 [58:43<3:48:06,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3179/15526 [58:43<3:48:06,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3180/15526 [58:44<3:48:03,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3180/15526 [58:44<3:48:03,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3181/15526 [58:45<3:48:01,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3181/15526 [58:45<3:48:01,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 3182/15526 [58:46<3:48:00,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 3182/15526 [58:46<3:48:00,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3183/15526 [58:47<3:47:57,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3183/15526 [58:47<3:47:57,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3184/15526 [58:48<3:47:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3184/15526 [58:48<3:47:56,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3185/15526 [58:49<3:47:56,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3185/15526 [58:49<3:47:56,  1.11s/it, v_num=73vx, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3186/15526 [58:50<3:47:53,  1.11s/it, v_num=73vx, train/loss=1.\r",
-      "Epoch 0:  21%|▏| 3186/15526 [58:50<3:47:53,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3187/15526 [58:51<3:47:52,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3187/15526 [58:51<3:47:52,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3188/15526 [58:52<3:47:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3188/15526 [58:52<3:47:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3189/15526 [58:53<3:47:51,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3189/15526 [58:53<3:47:51,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3190/15526 [58:54<3:47:48,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3190/15526 [58:54<3:47:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3191/15526 [58:55<3:47:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3191/15526 [58:55<3:47:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3192/15526 [58:56<3:47:44,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3192/15526 [58:56<3:47:44,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3193/15526 [58:57<3:47:41,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3193/15526 [58:57<3:47:41,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3194/15526 [58:57<3:47:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3194/15526 [58:57<3:47:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3195/15526 [58:58<3:47:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3195/15526 [58:58<3:47:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3196/15526 [58:59<3:47:33,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3196/15526 [58:59<3:47:33,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3197/15526 [59:00<3:47:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3197/15526 [59:00<3:47:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3198/15526 [59:00<3:47:29,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3198/15526 [59:00<3:47:29,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3199/15526 [59:01<3:47:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3199/15526 [59:01<3:47:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3200/15526 [59:09<3:47:50,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3200/15526 [59:09<3:47:50,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3201/15526 [59:33<3:49:17,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3201/15526 [59:33<3:49:17,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3202/15526 [59:34<3:49:17,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3202/15526 [59:34<3:49:17,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3203/15526 [59:35<3:49:14,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3203/15526 [59:35<3:49:14,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3204/15526 [59:35<3:49:11,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3204/15526 [59:35<3:49:11,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3205/15526 [59:36<3:49:08,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3205/15526 [59:36<3:49:08,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3206/15526 [59:37<3:49:08,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3206/15526 [59:37<3:49:08,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3207/15526 [59:38<3:49:05,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3207/15526 [59:38<3:49:05,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3208/15526 [59:38<3:49:02,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3208/15526 [59:38<3:49:02,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3209/15526 [59:39<3:48:59,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3209/15526 [59:39<3:48:59,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3210/15526 [59:40<3:48:56,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3210/15526 [59:40<3:48:56,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3211/15526 [59:41<3:48:54,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3211/15526 [59:41<3:48:54,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3212/15526 [59:41<3:48:51,  1.12s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3212/15526 [59:41<3:48:51,  1.12s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3213/15526 [59:42<3:48:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3213/15526 [59:42<3:48:48,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3214/15526 [59:43<3:48:45,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3214/15526 [59:43<3:48:45,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3215/15526 [59:43<3:48:43,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3215/15526 [59:43<3:48:43,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3216/15526 [59:45<3:48:42,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3216/15526 [59:45<3:48:42,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3217/15526 [59:45<3:48:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3217/15526 [59:45<3:48:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3218/15526 [59:46<3:48:39,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3218/15526 [59:46<3:48:39,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3219/15526 [59:47<3:48:36,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3219/15526 [59:47<3:48:36,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3220/15526 [59:48<3:48:35,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3220/15526 [59:48<3:48:35,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3221/15526 [59:49<3:48:32,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3221/15526 [59:49<3:48:32,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3222/15526 [59:50<3:48:29,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3222/15526 [59:50<3:48:29,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3223/15526 [59:50<3:48:27,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3223/15526 [59:50<3:48:27,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3224/15526 [59:51<3:48:24,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3224/15526 [59:51<3:48:24,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3225/15526 [59:52<3:48:23,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3225/15526 [59:52<3:48:23,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3226/15526 [59:53<3:48:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3226/15526 [59:53<3:48:20,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3227/15526 [59:54<3:48:20,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3227/15526 [59:54<3:48:20,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3228/15526 [59:55<3:48:17,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3228/15526 [59:55<3:48:17,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3229/15526 [59:56<3:48:14,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3229/15526 [59:56<3:48:14,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3230/15526 [59:56<3:48:12,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3230/15526 [59:56<3:48:12,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3231/15526 [59:57<3:48:11,  1.11s/it, v_num=73vx, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 3231/15526 [59:57<3:48:11,  1.11s/it, v_num=73vx, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3232/15526 [1:00:07<3:48:41,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3232/15526 [1:00:07<3:48:41,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3233/15526 [1:00:07<3:48:38,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3233/15526 [1:00:07<3:48:38,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3234/15526 [1:00:09<3:48:38,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3234/15526 [1:00:09<3:48:38,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3235/15526 [1:00:10<3:48:37,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3235/15526 [1:00:10<3:48:37,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3236/15526 [1:00:11<3:48:36,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3236/15526 [1:00:11<3:48:36,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3237/15526 [1:00:12<3:48:36,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3237/15526 [1:00:12<3:48:36,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3238/15526 [1:00:14<3:48:35,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3238/15526 [1:00:14<3:48:35,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3239/15526 [1:00:15<3:48:34,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3239/15526 [1:00:15<3:48:34,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3240/15526 [1:00:16<3:48:31,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3240/15526 [1:00:16<3:48:31,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3241/15526 [1:00:16<3:48:29,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3241/15526 [1:00:16<3:48:29,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3242/15526 [1:00:17<3:48:26,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3242/15526 [1:00:17<3:48:26,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3243/15526 [1:00:18<3:48:23,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3243/15526 [1:00:18<3:48:23,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3244/15526 [1:00:19<3:48:22,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3244/15526 [1:00:19<3:48:22,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3245/15526 [1:00:19<3:48:20,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3245/15526 [1:00:19<3:48:20,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3246/15526 [1:00:20<3:48:17,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3246/15526 [1:00:20<3:48:17,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3247/15526 [1:00:21<3:48:14,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3247/15526 [1:00:21<3:48:14,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3248/15526 [1:00:22<3:48:13,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3248/15526 [1:00:22<3:48:13,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3249/15526 [1:00:23<3:48:11,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3249/15526 [1:00:23<3:48:11,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3250/15526 [1:00:24<3:48:10,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3250/15526 [1:00:24<3:48:10,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3251/15526 [1:00:25<3:48:07,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3251/15526 [1:00:25<3:48:07,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3252/15526 [1:00:25<3:48:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3252/15526 [1:00:25<3:48:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3253/15526 [1:00:27<3:48:04,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3253/15526 [1:00:27<3:48:04,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3254/15526 [1:00:27<3:48:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3254/15526 [1:00:27<3:48:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3255/15526 [1:00:28<3:47:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3255/15526 [1:00:28<3:47:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3256/15526 [1:00:29<3:47:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3256/15526 [1:00:29<3:47:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3257/15526 [1:00:29<3:47:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3257/15526 [1:00:29<3:47:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3258/15526 [1:00:30<3:47:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3258/15526 [1:00:30<3:47:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3259/15526 [1:00:31<3:47:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3259/15526 [1:00:31<3:47:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3260/15526 [1:00:32<3:47:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3260/15526 [1:00:32<3:47:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3261/15526 [1:00:33<3:47:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3261/15526 [1:00:33<3:47:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3262/15526 [1:00:34<3:47:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3262/15526 [1:00:34<3:47:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3263/15526 [1:00:35<3:47:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3263/15526 [1:00:35<3:47:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3264/15526 [1:00:41<3:48:01,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3264/15526 [1:00:41<3:48:01,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3265/15526 [1:00:43<3:48:00,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3265/15526 [1:00:43<3:48:00,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3266/15526 [1:00:44<3:48:00,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3266/15526 [1:00:44<3:48:00,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3267/15526 [1:00:44<3:47:57,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3267/15526 [1:00:44<3:47:57,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3268/15526 [1:00:45<3:47:54,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3268/15526 [1:00:45<3:47:54,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3269/15526 [1:00:46<3:47:53,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3269/15526 [1:00:46<3:47:53,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3270/15526 [1:00:48<3:47:52,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3270/15526 [1:00:48<3:47:52,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3271/15526 [1:00:49<3:47:51,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3271/15526 [1:00:49<3:47:51,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3272/15526 [1:00:49<3:47:49,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3272/15526 [1:00:49<3:47:49,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3273/15526 [1:00:51<3:47:48,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3273/15526 [1:00:51<3:47:48,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3274/15526 [1:00:52<3:47:47,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3274/15526 [1:00:52<3:47:47,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3275/15526 [1:00:52<3:47:44,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3275/15526 [1:00:52<3:47:44,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3276/15526 [1:00:54<3:47:43,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3276/15526 [1:00:54<3:47:44,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3277/15526 [1:00:55<3:47:43,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3277/15526 [1:00:55<3:47:43,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3278/15526 [1:00:56<3:47:42,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3278/15526 [1:00:56<3:47:42,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3279/15526 [1:00:57<3:47:39,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3279/15526 [1:00:57<3:47:39,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3280/15526 [1:00:57<3:47:36,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3280/15526 [1:00:57<3:47:36,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3281/15526 [1:00:59<3:47:36,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3281/15526 [1:00:59<3:47:36,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3282/15526 [1:01:00<3:47:35,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3282/15526 [1:01:00<3:47:35,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3283/15526 [1:01:00<3:47:32,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3283/15526 [1:01:00<3:47:32,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3284/15526 [1:01:02<3:47:31,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3284/15526 [1:01:02<3:47:31,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3285/15526 [1:01:02<3:47:28,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3285/15526 [1:01:02<3:47:28,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3286/15526 [1:01:04<3:47:28,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3286/15526 [1:01:04<3:47:28,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3287/15526 [1:01:04<3:47:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3287/15526 [1:01:04<3:47:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3288/15526 [1:01:05<3:47:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3288/15526 [1:01:05<3:47:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3289/15526 [1:01:06<3:47:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3289/15526 [1:01:06<3:47:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3290/15526 [1:01:06<3:47:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3290/15526 [1:01:06<3:47:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3291/15526 [1:01:07<3:47:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3291/15526 [1:01:07<3:47:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3292/15526 [1:01:08<3:47:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3292/15526 [1:01:08<3:47:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3293/15526 [1:01:09<3:47:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3293/15526 [1:01:09<3:47:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3294/15526 [1:01:10<3:47:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3294/15526 [1:01:10<3:47:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3295/15526 [1:01:12<3:47:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3295/15526 [1:01:12<3:47:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3296/15526 [1:01:18<3:47:27,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3296/15526 [1:01:18<3:47:27,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3297/15526 [1:01:19<3:47:27,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3297/15526 [1:01:19<3:47:27,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3298/15526 [1:01:20<3:47:24,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3298/15526 [1:01:20<3:47:24,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3299/15526 [1:01:21<3:47:23,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3299/15526 [1:01:21<3:47:23,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3300/15526 [1:01:21<3:47:21,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3300/15526 [1:01:21<3:47:21,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3301/15526 [1:01:22<3:47:18,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3301/15526 [1:01:22<3:47:18,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3302/15526 [1:01:23<3:47:15,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3302/15526 [1:01:23<3:47:15,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3303/15526 [1:01:24<3:47:14,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3303/15526 [1:01:24<3:47:15,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3304/15526 [1:01:25<3:47:12,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3304/15526 [1:01:25<3:47:12,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3305/15526 [1:01:25<3:47:09,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3305/15526 [1:01:25<3:47:09,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3306/15526 [1:01:27<3:47:08,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3306/15526 [1:01:27<3:47:08,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3307/15526 [1:01:27<3:47:06,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3307/15526 [1:01:27<3:47:06,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3308/15526 [1:01:28<3:47:03,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3308/15526 [1:01:28<3:47:03,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3309/15526 [1:01:29<3:47:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3309/15526 [1:01:29<3:47:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3310/15526 [1:01:30<3:47:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3310/15526 [1:01:30<3:47:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3311/15526 [1:01:31<3:46:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3311/15526 [1:01:31<3:46:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3312/15526 [1:01:32<3:46:58,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3312/15526 [1:01:32<3:46:58,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3313/15526 [1:01:33<3:46:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3313/15526 [1:01:33<3:46:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3314/15526 [1:01:34<3:46:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3314/15526 [1:01:34<3:46:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3315/15526 [1:01:34<3:46:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3315/15526 [1:01:34<3:46:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3316/15526 [1:01:35<3:46:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3316/15526 [1:01:35<3:46:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3317/15526 [1:01:36<3:46:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3317/15526 [1:01:36<3:46:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3318/15526 [1:01:36<3:46:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3318/15526 [1:01:36<3:46:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3319/15526 [1:01:38<3:46:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3319/15526 [1:01:38<3:46:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3320/15526 [1:01:38<3:46:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3320/15526 [1:01:38<3:46:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3321/15526 [1:01:40<3:46:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3321/15526 [1:01:40<3:46:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3322/15526 [1:01:40<3:46:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3322/15526 [1:01:40<3:46:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3323/15526 [1:01:41<3:46:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3323/15526 [1:01:41<3:46:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3324/15526 [1:01:42<3:46:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3324/15526 [1:01:42<3:46:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3325/15526 [1:01:43<3:46:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3325/15526 [1:01:43<3:46:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3326/15526 [1:01:43<3:46:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3326/15526 [1:01:43<3:46:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3327/15526 [1:01:44<3:46:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3327/15526 [1:01:44<3:46:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3328/15526 [1:01:53<3:46:52,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3328/15526 [1:01:53<3:46:52,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3329/15526 [1:01:54<3:46:49,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3329/15526 [1:01:54<3:46:49,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3330/15526 [1:01:55<3:46:46,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3330/15526 [1:01:55<3:46:46,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3331/15526 [1:01:55<3:46:43,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3331/15526 [1:01:55<3:46:43,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3332/15526 [1:01:56<3:46:41,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3332/15526 [1:01:56<3:46:41,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3333/15526 [1:01:57<3:46:40,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3333/15526 [1:01:57<3:46:40,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3334/15526 [1:01:58<3:46:39,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3334/15526 [1:01:58<3:46:39,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3335/15526 [1:01:59<3:46:37,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3335/15526 [1:01:59<3:46:37,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3336/15526 [1:02:00<3:46:36,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3336/15526 [1:02:00<3:46:36,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3337/15526 [1:02:01<3:46:33,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3337/15526 [1:02:01<3:46:33,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 3338/15526 [1:02:02<3:46:30,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  21%|▏| 3338/15526 [1:02:02<3:46:30,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3339/15526 [1:02:02<3:46:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3339/15526 [1:02:02<3:46:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3340/15526 [1:02:03<3:46:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3340/15526 [1:02:03<3:46:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3341/15526 [1:02:04<3:46:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3341/15526 [1:02:04<3:46:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3342/15526 [1:02:05<3:46:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3342/15526 [1:02:05<3:46:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3343/15526 [1:02:06<3:46:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3343/15526 [1:02:06<3:46:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3344/15526 [1:02:07<3:46:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3344/15526 [1:02:07<3:46:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3345/15526 [1:02:08<3:46:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3345/15526 [1:02:08<3:46:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3346/15526 [1:02:09<3:46:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3346/15526 [1:02:09<3:46:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3347/15526 [1:02:10<3:46:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3347/15526 [1:02:10<3:46:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3348/15526 [1:02:11<3:46:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3348/15526 [1:02:11<3:46:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3349/15526 [1:02:12<3:46:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3349/15526 [1:02:12<3:46:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3350/15526 [1:02:13<3:46:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3350/15526 [1:02:13<3:46:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3351/15526 [1:02:13<3:46:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3351/15526 [1:02:13<3:46:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3352/15526 [1:02:14<3:46:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3352/15526 [1:02:14<3:46:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3353/15526 [1:02:15<3:46:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3353/15526 [1:02:15<3:46:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3354/15526 [1:02:16<3:45:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3354/15526 [1:02:16<3:45:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3355/15526 [1:02:17<3:45:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3355/15526 [1:02:17<3:45:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3356/15526 [1:02:17<3:45:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3356/15526 [1:02:17<3:45:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3357/15526 [1:02:18<3:45:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3357/15526 [1:02:18<3:45:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3358/15526 [1:02:19<3:45:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3358/15526 [1:02:19<3:45:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3359/15526 [1:02:20<3:45:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3359/15526 [1:02:20<3:45:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3360/15526 [1:02:27<3:46:10,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3360/15526 [1:02:27<3:46:10,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3361/15526 [1:02:29<3:46:09,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3361/15526 [1:02:29<3:46:09,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3362/15526 [1:02:29<3:46:07,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3362/15526 [1:02:29<3:46:07,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3363/15526 [1:02:30<3:46:04,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3363/15526 [1:02:30<3:46:04,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3364/15526 [1:02:31<3:46:01,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3364/15526 [1:02:31<3:46:01,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3365/15526 [1:02:32<3:46:01,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3365/15526 [1:02:32<3:46:01,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3366/15526 [1:02:33<3:46:00,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3366/15526 [1:02:33<3:46:00,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3367/15526 [1:02:34<3:45:57,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3367/15526 [1:02:34<3:45:57,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3368/15526 [1:02:35<3:45:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3368/15526 [1:02:35<3:45:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3369/15526 [1:02:35<3:45:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3369/15526 [1:02:35<3:45:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3370/15526 [1:02:36<3:45:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3370/15526 [1:02:36<3:45:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3371/15526 [1:02:38<3:45:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3371/15526 [1:02:38<3:45:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3372/15526 [1:02:38<3:45:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3372/15526 [1:02:38<3:45:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3373/15526 [1:02:40<3:45:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3373/15526 [1:02:40<3:45:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3374/15526 [1:02:40<3:45:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3374/15526 [1:02:40<3:45:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3375/15526 [1:02:41<3:45:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3375/15526 [1:02:41<3:45:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3376/15526 [1:02:42<3:45:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3376/15526 [1:02:42<3:45:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3377/15526 [1:02:43<3:45:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3377/15526 [1:02:43<3:45:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3378/15526 [1:02:44<3:45:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3378/15526 [1:02:44<3:45:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3379/15526 [1:02:45<3:45:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3379/15526 [1:02:45<3:45:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3380/15526 [1:02:47<3:45:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3380/15526 [1:02:47<3:45:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3381/15526 [1:02:47<3:45:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3381/15526 [1:02:47<3:45:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3382/15526 [1:02:48<3:45:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3382/15526 [1:02:48<3:45:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3383/15526 [1:02:49<3:45:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3383/15526 [1:02:49<3:45:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3384/15526 [1:02:49<3:45:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3384/15526 [1:02:49<3:45:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3385/15526 [1:02:50<3:45:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3385/15526 [1:02:50<3:45:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3386/15526 [1:02:51<3:45:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3386/15526 [1:02:51<3:45:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3387/15526 [1:02:52<3:45:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3387/15526 [1:02:52<3:45:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3388/15526 [1:02:53<3:45:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3388/15526 [1:02:53<3:45:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3389/15526 [1:02:54<3:45:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3389/15526 [1:02:54<3:45:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3390/15526 [1:02:55<3:45:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3390/15526 [1:02:55<3:45:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3391/15526 [1:02:56<3:45:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3391/15526 [1:02:56<3:45:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3392/15526 [1:03:02<3:45:30,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3392/15526 [1:03:02<3:45:30,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3393/15526 [1:03:03<3:45:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3393/15526 [1:03:03<3:45:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3394/15526 [1:03:03<3:45:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3394/15526 [1:03:03<3:45:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3395/15526 [1:03:04<3:45:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3395/15526 [1:03:04<3:45:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3396/15526 [1:03:05<3:45:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3396/15526 [1:03:05<3:45:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3397/15526 [1:03:05<3:45:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3397/15526 [1:03:05<3:45:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3398/15526 [1:03:06<3:45:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3398/15526 [1:03:06<3:45:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3399/15526 [1:03:07<3:45:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3399/15526 [1:03:07<3:45:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3400/15526 [1:03:08<3:45:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3400/15526 [1:03:08<3:45:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3401/15526 [1:03:08<3:45:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3401/15526 [1:03:08<3:45:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3402/15526 [1:03:10<3:45:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3402/15526 [1:03:10<3:45:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3403/15526 [1:03:10<3:45:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3403/15526 [1:03:10<3:45:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3404/15526 [1:03:11<3:45:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3404/15526 [1:03:11<3:45:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3405/15526 [1:03:13<3:45:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3405/15526 [1:03:13<3:45:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3406/15526 [1:03:14<3:45:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3406/15526 [1:03:14<3:45:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3407/15526 [1:03:14<3:44:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3407/15526 [1:03:14<3:44:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3408/15526 [1:03:15<3:44:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3408/15526 [1:03:15<3:44:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3409/15526 [1:03:16<3:44:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3409/15526 [1:03:16<3:44:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3410/15526 [1:03:17<3:44:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3410/15526 [1:03:17<3:44:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3411/15526 [1:03:18<3:44:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3411/15526 [1:03:18<3:44:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3412/15526 [1:03:18<3:44:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3412/15526 [1:03:18<3:44:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3413/15526 [1:03:20<3:44:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3413/15526 [1:03:20<3:44:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3414/15526 [1:03:20<3:44:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3414/15526 [1:03:20<3:44:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3415/15526 [1:03:22<3:44:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3415/15526 [1:03:22<3:44:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3416/15526 [1:03:22<3:44:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3416/15526 [1:03:22<3:44:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3417/15526 [1:03:23<3:44:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3417/15526 [1:03:23<3:44:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3418/15526 [1:03:24<3:44:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3418/15526 [1:03:24<3:44:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3419/15526 [1:03:25<3:44:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3419/15526 [1:03:25<3:44:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3420/15526 [1:03:26<3:44:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3420/15526 [1:03:26<3:44:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3421/15526 [1:03:26<3:44:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3421/15526 [1:03:26<3:44:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3422/15526 [1:03:27<3:44:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3422/15526 [1:03:27<3:44:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3423/15526 [1:03:28<3:44:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3423/15526 [1:03:28<3:44:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3424/15526 [1:03:39<3:45:00,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3424/15526 [1:03:39<3:45:00,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3425/15526 [1:03:40<3:44:57,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3425/15526 [1:03:40<3:44:57,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3426/15526 [1:03:41<3:44:57,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3426/15526 [1:03:41<3:44:57,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3427/15526 [1:03:42<3:44:56,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3427/15526 [1:03:42<3:44:56,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3428/15526 [1:03:43<3:44:54,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3428/15526 [1:03:43<3:44:54,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3429/15526 [1:03:44<3:44:51,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3429/15526 [1:03:44<3:44:51,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3430/15526 [1:03:45<3:44:49,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3430/15526 [1:03:45<3:44:49,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3431/15526 [1:03:45<3:44:46,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3431/15526 [1:03:45<3:44:46,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3432/15526 [1:03:46<3:44:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3432/15526 [1:03:46<3:44:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3433/15526 [1:03:47<3:44:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3433/15526 [1:03:47<3:44:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3434/15526 [1:03:48<3:44:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3434/15526 [1:03:48<3:44:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3435/15526 [1:03:49<3:44:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3435/15526 [1:03:49<3:44:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3436/15526 [1:03:50<3:44:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3436/15526 [1:03:50<3:44:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3437/15526 [1:03:51<3:44:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3437/15526 [1:03:51<3:44:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3438/15526 [1:03:52<3:44:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3438/15526 [1:03:52<3:44:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3439/15526 [1:03:53<3:44:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3439/15526 [1:03:53<3:44:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3440/15526 [1:03:54<3:44:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3440/15526 [1:03:54<3:44:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3441/15526 [1:03:55<3:44:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3441/15526 [1:03:55<3:44:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3442/15526 [1:03:55<3:44:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3442/15526 [1:03:55<3:44:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3443/15526 [1:03:57<3:44:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3443/15526 [1:03:57<3:44:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3444/15526 [1:03:57<3:44:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3444/15526 [1:03:57<3:44:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3445/15526 [1:03:58<3:44:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3445/15526 [1:03:58<3:44:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3446/15526 [1:03:59<3:44:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3446/15526 [1:03:59<3:44:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3447/15526 [1:04:00<3:44:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3447/15526 [1:04:00<3:44:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3448/15526 [1:04:01<3:44:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3448/15526 [1:04:01<3:44:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3449/15526 [1:04:02<3:44:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3449/15526 [1:04:02<3:44:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3450/15526 [1:04:03<3:44:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3450/15526 [1:04:03<3:44:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3451/15526 [1:04:04<3:44:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3451/15526 [1:04:04<3:44:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3452/15526 [1:04:04<3:44:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3452/15526 [1:04:04<3:44:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3453/15526 [1:04:05<3:44:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3453/15526 [1:04:05<3:44:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3454/15526 [1:04:06<3:44:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3454/15526 [1:04:06<3:44:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3455/15526 [1:04:07<3:44:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3455/15526 [1:04:07<3:44:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3456/15526 [1:04:13<3:44:18,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3456/15526 [1:04:13<3:44:18,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3457/15526 [1:04:14<3:44:17,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3457/15526 [1:04:14<3:44:17,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3458/15526 [1:04:15<3:44:16,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3458/15526 [1:04:15<3:44:16,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3459/15526 [1:04:17<3:44:15,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3459/15526 [1:04:17<3:44:15,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3460/15526 [1:04:18<3:44:15,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3460/15526 [1:04:18<3:44:15,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3461/15526 [1:04:19<3:44:12,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3461/15526 [1:04:19<3:44:12,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3462/15526 [1:04:20<3:44:11,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3462/15526 [1:04:20<3:44:11,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3463/15526 [1:04:20<3:44:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3463/15526 [1:04:20<3:44:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3464/15526 [1:04:21<3:44:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3464/15526 [1:04:21<3:44:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3465/15526 [1:04:22<3:44:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3465/15526 [1:04:22<3:44:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3466/15526 [1:04:23<3:44:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3466/15526 [1:04:23<3:44:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3467/15526 [1:04:23<3:43:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3467/15526 [1:04:23<3:43:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3468/15526 [1:04:24<3:43:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3468/15526 [1:04:24<3:43:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3469/15526 [1:04:25<3:43:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3469/15526 [1:04:25<3:43:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3470/15526 [1:04:26<3:43:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3470/15526 [1:04:26<3:43:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3471/15526 [1:04:27<3:43:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3471/15526 [1:04:27<3:43:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3472/15526 [1:04:28<3:43:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3472/15526 [1:04:28<3:43:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3473/15526 [1:04:28<3:43:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3473/15526 [1:04:28<3:43:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3474/15526 [1:04:29<3:43:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3474/15526 [1:04:29<3:43:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3475/15526 [1:04:30<3:43:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3475/15526 [1:04:30<3:43:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3476/15526 [1:04:30<3:43:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3476/15526 [1:04:30<3:43:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3477/15526 [1:04:31<3:43:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3477/15526 [1:04:31<3:43:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3478/15526 [1:04:32<3:43:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3478/15526 [1:04:32<3:43:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3479/15526 [1:04:33<3:43:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3479/15526 [1:04:33<3:43:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3480/15526 [1:04:33<3:43:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3480/15526 [1:04:33<3:43:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3481/15526 [1:04:34<3:43:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3481/15526 [1:04:34<3:43:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3482/15526 [1:04:35<3:43:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3482/15526 [1:04:35<3:43:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3483/15526 [1:04:36<3:43:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3483/15526 [1:04:36<3:43:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3484/15526 [1:04:37<3:43:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3484/15526 [1:04:37<3:43:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3485/15526 [1:04:37<3:43:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3485/15526 [1:04:37<3:43:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3486/15526 [1:04:38<3:43:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3486/15526 [1:04:38<3:43:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3487/15526 [1:04:39<3:43:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3487/15526 [1:04:39<3:43:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3488/15526 [1:04:47<3:43:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3488/15526 [1:04:47<3:43:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3489/15526 [1:04:48<3:43:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3489/15526 [1:04:48<3:43:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3490/15526 [1:04:49<3:43:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3490/15526 [1:04:49<3:43:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3491/15526 [1:04:50<3:43:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3491/15526 [1:04:50<3:43:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3492/15526 [1:04:50<3:43:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3492/15526 [1:04:50<3:43:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 3493/15526 [1:04:51<3:43:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  22%|▏| 3493/15526 [1:04:51<3:43:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3494/15526 [1:04:52<3:43:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3494/15526 [1:04:52<3:43:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3495/15526 [1:04:53<3:43:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3495/15526 [1:04:53<3:43:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3496/15526 [1:04:54<3:43:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3496/15526 [1:04:54<3:43:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3497/15526 [1:04:54<3:43:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3497/15526 [1:04:54<3:43:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3498/15526 [1:04:55<3:43:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3498/15526 [1:04:55<3:43:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3499/15526 [1:04:56<3:43:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3499/15526 [1:04:56<3:43:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3500/15526 [1:04:57<3:43:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3500/15526 [1:04:57<3:43:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3501/15526 [1:04:58<3:43:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3501/15526 [1:04:58<3:43:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3502/15526 [1:04:58<3:43:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3502/15526 [1:04:58<3:43:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3503/15526 [1:04:59<3:43:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3503/15526 [1:04:59<3:43:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3504/15526 [1:05:01<3:43:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3504/15526 [1:05:01<3:43:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3505/15526 [1:05:02<3:43:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3505/15526 [1:05:02<3:43:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3506/15526 [1:05:02<3:43:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3506/15526 [1:05:02<3:43:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3507/15526 [1:05:03<3:42:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3507/15526 [1:05:03<3:42:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3508/15526 [1:05:04<3:42:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3508/15526 [1:05:04<3:42:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3509/15526 [1:05:05<3:42:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3509/15526 [1:05:05<3:42:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3510/15526 [1:05:06<3:42:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3510/15526 [1:05:06<3:42:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3511/15526 [1:05:06<3:42:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3511/15526 [1:05:06<3:42:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3512/15526 [1:05:07<3:42:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3512/15526 [1:05:07<3:42:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3513/15526 [1:05:08<3:42:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3513/15526 [1:05:08<3:42:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3514/15526 [1:05:09<3:42:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3514/15526 [1:05:09<3:42:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3515/15526 [1:05:10<3:42:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3515/15526 [1:05:10<3:42:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3516/15526 [1:05:11<3:42:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3516/15526 [1:05:11<3:42:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3517/15526 [1:05:11<3:42:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3517/15526 [1:05:11<3:42:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3518/15526 [1:05:12<3:42:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3518/15526 [1:05:12<3:42:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3519/15526 [1:05:13<3:42:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3519/15526 [1:05:13<3:42:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3520/15526 [1:05:21<3:42:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3520/15526 [1:05:21<3:42:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3521/15526 [1:05:22<3:42:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3521/15526 [1:05:22<3:42:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3522/15526 [1:05:23<3:42:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3522/15526 [1:05:23<3:42:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3523/15526 [1:05:24<3:42:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3523/15526 [1:05:24<3:42:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3524/15526 [1:05:24<3:42:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3524/15526 [1:05:24<3:42:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3525/15526 [1:05:25<3:42:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3525/15526 [1:05:25<3:42:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3526/15526 [1:05:26<3:42:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3526/15526 [1:05:26<3:42:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3527/15526 [1:05:27<3:42:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3527/15526 [1:05:27<3:42:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3528/15526 [1:05:27<3:42:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3528/15526 [1:05:27<3:42:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3529/15526 [1:05:28<3:42:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3529/15526 [1:05:28<3:42:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3530/15526 [1:05:29<3:42:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3530/15526 [1:05:29<3:42:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3531/15526 [1:05:29<3:42:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3531/15526 [1:05:29<3:42:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3532/15526 [1:05:30<3:42:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3532/15526 [1:05:30<3:42:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3533/15526 [1:05:31<3:42:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3533/15526 [1:05:31<3:42:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3534/15526 [1:05:32<3:42:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3534/15526 [1:05:32<3:42:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3535/15526 [1:05:33<3:42:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3535/15526 [1:05:33<3:42:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3536/15526 [1:05:34<3:42:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3536/15526 [1:05:34<3:42:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3537/15526 [1:05:34<3:42:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3537/15526 [1:05:34<3:42:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3538/15526 [1:05:36<3:42:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3538/15526 [1:05:36<3:42:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3539/15526 [1:05:36<3:42:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3539/15526 [1:05:36<3:42:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3540/15526 [1:05:38<3:42:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3540/15526 [1:05:38<3:42:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3541/15526 [1:05:38<3:42:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3541/15526 [1:05:38<3:42:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3542/15526 [1:05:39<3:42:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3542/15526 [1:05:39<3:42:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3543/15526 [1:05:40<3:42:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3543/15526 [1:05:40<3:42:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3544/15526 [1:05:40<3:42:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3544/15526 [1:05:40<3:42:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3545/15526 [1:05:41<3:42:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3545/15526 [1:05:41<3:42:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3546/15526 [1:05:42<3:42:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3546/15526 [1:05:42<3:42:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3547/15526 [1:05:43<3:41:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3547/15526 [1:05:43<3:41:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3548/15526 [1:05:44<3:41:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3548/15526 [1:05:44<3:41:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3549/15526 [1:05:45<3:41:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3549/15526 [1:05:45<3:41:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3550/15526 [1:05:46<3:41:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3550/15526 [1:05:46<3:41:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3551/15526 [1:05:47<3:41:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3551/15526 [1:05:47<3:41:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3552/15526 [1:05:56<3:42:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3552/15526 [1:05:56<3:42:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3553/15526 [1:05:56<3:42:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3553/15526 [1:05:56<3:42:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3554/15526 [1:05:58<3:42:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3554/15526 [1:05:58<3:42:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3555/15526 [1:05:59<3:42:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3555/15526 [1:05:59<3:42:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3556/15526 [1:06:00<3:42:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3556/15526 [1:06:00<3:42:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3557/15526 [1:06:01<3:42:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3557/15526 [1:06:01<3:42:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3558/15526 [1:06:02<3:42:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3558/15526 [1:06:02<3:42:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3559/15526 [1:06:02<3:42:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3559/15526 [1:06:02<3:42:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3560/15526 [1:06:03<3:42:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3560/15526 [1:06:03<3:42:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3561/15526 [1:06:04<3:41:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3561/15526 [1:06:04<3:41:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3562/15526 [1:06:04<3:41:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3562/15526 [1:06:04<3:41:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3563/15526 [1:06:05<3:41:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3563/15526 [1:06:05<3:41:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3564/15526 [1:06:06<3:41:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3564/15526 [1:06:06<3:41:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3565/15526 [1:06:07<3:41:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3565/15526 [1:06:07<3:41:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3566/15526 [1:06:08<3:41:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3566/15526 [1:06:08<3:41:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3567/15526 [1:06:09<3:41:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3567/15526 [1:06:09<3:41:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3568/15526 [1:06:10<3:41:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3568/15526 [1:06:10<3:41:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3569/15526 [1:06:11<3:41:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3569/15526 [1:06:11<3:41:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3570/15526 [1:06:12<3:41:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3570/15526 [1:06:12<3:41:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3571/15526 [1:06:13<3:41:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3571/15526 [1:06:13<3:41:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3572/15526 [1:06:14<3:41:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3572/15526 [1:06:14<3:41:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3573/15526 [1:06:15<3:41:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3573/15526 [1:06:15<3:41:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3574/15526 [1:06:15<3:41:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3574/15526 [1:06:15<3:41:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3575/15526 [1:06:16<3:41:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3575/15526 [1:06:16<3:41:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3576/15526 [1:06:17<3:41:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3576/15526 [1:06:17<3:41:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3577/15526 [1:06:18<3:41:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3577/15526 [1:06:18<3:41:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3578/15526 [1:06:19<3:41:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3578/15526 [1:06:19<3:41:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3579/15526 [1:06:20<3:41:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3579/15526 [1:06:20<3:41:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3580/15526 [1:06:21<3:41:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3580/15526 [1:06:21<3:41:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3581/15526 [1:06:22<3:41:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3581/15526 [1:06:22<3:41:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3582/15526 [1:06:23<3:41:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3582/15526 [1:06:23<3:41:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3583/15526 [1:06:24<3:41:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3583/15526 [1:06:24<3:41:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3584/15526 [1:06:30<3:41:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3584/15526 [1:06:30<3:41:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3585/15526 [1:06:30<3:41:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3585/15526 [1:06:30<3:41:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3586/15526 [1:06:31<3:41:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3586/15526 [1:06:31<3:41:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3587/15526 [1:06:32<3:41:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3587/15526 [1:06:32<3:41:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3588/15526 [1:06:33<3:41:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3588/15526 [1:06:33<3:41:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3589/15526 [1:06:34<3:41:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3589/15526 [1:06:34<3:41:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3590/15526 [1:06:35<3:41:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3590/15526 [1:06:35<3:41:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3591/15526 [1:06:36<3:41:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3591/15526 [1:06:36<3:41:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3592/15526 [1:06:37<3:41:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3592/15526 [1:06:37<3:41:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3593/15526 [1:06:38<3:41:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3593/15526 [1:06:38<3:41:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3594/15526 [1:06:39<3:41:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3594/15526 [1:06:39<3:41:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3595/15526 [1:06:39<3:41:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3595/15526 [1:06:39<3:41:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3596/15526 [1:06:40<3:41:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3596/15526 [1:06:40<3:41:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3597/15526 [1:06:41<3:41:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3597/15526 [1:06:41<3:41:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3598/15526 [1:06:41<3:41:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3598/15526 [1:06:41<3:41:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3599/15526 [1:06:42<3:41:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3599/15526 [1:06:42<3:41:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3600/15526 [1:06:43<3:41:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3600/15526 [1:06:43<3:41:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3601/15526 [1:06:44<3:41:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3601/15526 [1:06:44<3:41:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3602/15526 [1:06:45<3:40:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3602/15526 [1:06:45<3:40:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3603/15526 [1:06:46<3:40:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3603/15526 [1:06:46<3:40:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3604/15526 [1:06:46<3:40:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3604/15526 [1:06:46<3:40:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3605/15526 [1:06:47<3:40:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3605/15526 [1:06:47<3:40:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3606/15526 [1:06:48<3:40:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3606/15526 [1:06:48<3:40:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3607/15526 [1:06:49<3:40:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3607/15526 [1:06:49<3:40:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3608/15526 [1:06:50<3:40:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3608/15526 [1:06:50<3:40:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3609/15526 [1:06:51<3:40:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3609/15526 [1:06:51<3:40:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3610/15526 [1:06:52<3:40:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3610/15526 [1:06:52<3:40:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3611/15526 [1:06:53<3:40:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3611/15526 [1:06:53<3:40:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3612/15526 [1:06:54<3:40:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3612/15526 [1:06:54<3:40:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3613/15526 [1:06:55<3:40:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3613/15526 [1:06:55<3:40:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3614/15526 [1:06:56<3:40:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3614/15526 [1:06:56<3:40:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3615/15526 [1:06:57<3:40:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3615/15526 [1:06:57<3:40:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3616/15526 [1:07:05<3:40:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3616/15526 [1:07:05<3:40:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3617/15526 [1:07:06<3:40:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3617/15526 [1:07:06<3:40:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3618/15526 [1:07:06<3:40:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3618/15526 [1:07:06<3:40:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3619/15526 [1:07:07<3:40:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3619/15526 [1:07:07<3:40:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3620/15526 [1:07:08<3:40:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3620/15526 [1:07:08<3:40:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3621/15526 [1:07:09<3:40:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3621/15526 [1:07:09<3:40:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3622/15526 [1:07:09<3:40:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3622/15526 [1:07:09<3:40:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3623/15526 [1:07:10<3:40:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3623/15526 [1:07:10<3:40:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3624/15526 [1:07:11<3:40:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3624/15526 [1:07:11<3:40:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3625/15526 [1:07:12<3:40:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3625/15526 [1:07:12<3:40:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3626/15526 [1:07:14<3:40:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3626/15526 [1:07:14<3:40:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3627/15526 [1:07:15<3:40:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3627/15526 [1:07:15<3:40:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3628/15526 [1:07:15<3:40:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3628/15526 [1:07:15<3:40:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3629/15526 [1:07:16<3:40:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3629/15526 [1:07:16<3:40:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3630/15526 [1:07:17<3:40:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3630/15526 [1:07:17<3:40:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3631/15526 [1:07:17<3:40:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3631/15526 [1:07:17<3:40:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3632/15526 [1:07:19<3:40:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3632/15526 [1:07:19<3:40:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3633/15526 [1:07:19<3:40:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3633/15526 [1:07:19<3:40:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3634/15526 [1:07:20<3:40:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3634/15526 [1:07:20<3:40:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3635/15526 [1:07:21<3:40:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3635/15526 [1:07:21<3:40:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3636/15526 [1:07:21<3:40:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3636/15526 [1:07:21<3:40:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3637/15526 [1:07:22<3:40:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3637/15526 [1:07:22<3:40:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3638/15526 [1:07:23<3:40:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3638/15526 [1:07:23<3:40:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3639/15526 [1:07:24<3:40:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3639/15526 [1:07:24<3:40:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3640/15526 [1:07:25<3:40:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3640/15526 [1:07:25<3:40:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3641/15526 [1:07:26<3:40:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3641/15526 [1:07:26<3:40:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3642/15526 [1:07:27<3:40:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3642/15526 [1:07:27<3:40:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3643/15526 [1:07:28<3:40:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3643/15526 [1:07:28<3:40:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3644/15526 [1:07:29<3:40:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3644/15526 [1:07:29<3:40:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3645/15526 [1:07:29<3:40:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3645/15526 [1:07:29<3:40:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3646/15526 [1:07:30<3:39:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3646/15526 [1:07:30<3:39:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3647/15526 [1:07:32<3:39:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3647/15526 [1:07:32<3:39:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 3648/15526 [1:07:40<3:40:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  23%|▏| 3648/15526 [1:07:40<3:40:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3649/15526 [1:07:41<3:40:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3649/15526 [1:07:41<3:40:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3650/15526 [1:07:41<3:40:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3650/15526 [1:07:41<3:40:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3651/15526 [1:07:42<3:40:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3651/15526 [1:07:42<3:40:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3652/15526 [1:07:43<3:40:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3652/15526 [1:07:43<3:40:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3653/15526 [1:07:44<3:40:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3653/15526 [1:07:44<3:40:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3654/15526 [1:07:45<3:40:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3654/15526 [1:07:45<3:40:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3655/15526 [1:07:47<3:40:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3655/15526 [1:07:47<3:40:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3656/15526 [1:07:47<3:40:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3656/15526 [1:07:47<3:40:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3657/15526 [1:07:48<3:40:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3657/15526 [1:07:48<3:40:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3658/15526 [1:07:49<3:40:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3658/15526 [1:07:49<3:40:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3659/15526 [1:07:50<3:40:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3659/15526 [1:07:50<3:40:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3660/15526 [1:07:50<3:39:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3660/15526 [1:07:50<3:39:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3661/15526 [1:07:52<3:39:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3661/15526 [1:07:52<3:39:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3662/15526 [1:07:53<3:39:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3662/15526 [1:07:53<3:39:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3663/15526 [1:07:54<3:39:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3663/15526 [1:07:54<3:39:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3664/15526 [1:07:55<3:39:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3664/15526 [1:07:55<3:39:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3665/15526 [1:07:56<3:39:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3665/15526 [1:07:56<3:39:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3666/15526 [1:07:57<3:39:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3666/15526 [1:07:57<3:39:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3667/15526 [1:07:58<3:39:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3667/15526 [1:07:58<3:39:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3668/15526 [1:07:59<3:39:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3668/15526 [1:07:59<3:39:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3669/15526 [1:08:00<3:39:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3669/15526 [1:08:00<3:39:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3670/15526 [1:08:01<3:39:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3670/15526 [1:08:01<3:39:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3671/15526 [1:08:02<3:39:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3671/15526 [1:08:02<3:39:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3672/15526 [1:08:03<3:39:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3672/15526 [1:08:03<3:39:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3673/15526 [1:08:03<3:39:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3673/15526 [1:08:03<3:39:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3674/15526 [1:08:04<3:39:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3674/15526 [1:08:04<3:39:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3675/15526 [1:08:05<3:39:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3675/15526 [1:08:05<3:39:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3676/15526 [1:08:06<3:39:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3676/15526 [1:08:06<3:39:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3677/15526 [1:08:07<3:39:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3677/15526 [1:08:07<3:39:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3678/15526 [1:08:08<3:39:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3678/15526 [1:08:08<3:39:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3679/15526 [1:08:09<3:39:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3679/15526 [1:08:09<3:39:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3680/15526 [1:08:15<3:39:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3680/15526 [1:08:15<3:39:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3681/15526 [1:08:16<3:39:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3681/15526 [1:08:16<3:39:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3682/15526 [1:08:17<3:39:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3682/15526 [1:08:17<3:39:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3683/15526 [1:08:18<3:39:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3683/15526 [1:08:18<3:39:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3684/15526 [1:08:19<3:39:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3684/15526 [1:08:19<3:39:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3685/15526 [1:08:20<3:39:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3685/15526 [1:08:20<3:39:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3686/15526 [1:08:21<3:39:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3686/15526 [1:08:21<3:39:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3687/15526 [1:08:22<3:39:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3687/15526 [1:08:22<3:39:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3688/15526 [1:08:23<3:39:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3688/15526 [1:08:23<3:39:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3689/15526 [1:08:24<3:39:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3689/15526 [1:08:24<3:39:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3690/15526 [1:08:25<3:39:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3690/15526 [1:08:25<3:39:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3691/15526 [1:08:26<3:39:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3691/15526 [1:08:26<3:39:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3692/15526 [1:08:27<3:39:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3692/15526 [1:08:27<3:39:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3693/15526 [1:08:28<3:39:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3693/15526 [1:08:28<3:39:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3694/15526 [1:08:29<3:39:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3694/15526 [1:08:29<3:39:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3695/15526 [1:08:29<3:39:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3695/15526 [1:08:29<3:39:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3696/15526 [1:08:30<3:39:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3696/15526 [1:08:30<3:39:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3697/15526 [1:08:31<3:39:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3697/15526 [1:08:31<3:39:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3698/15526 [1:08:31<3:39:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3698/15526 [1:08:31<3:39:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3699/15526 [1:08:32<3:39:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3699/15526 [1:08:32<3:39:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3700/15526 [1:08:33<3:39:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3700/15526 [1:08:33<3:39:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3701/15526 [1:08:33<3:39:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3701/15526 [1:08:33<3:39:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3702/15526 [1:08:35<3:39:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3702/15526 [1:08:35<3:39:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3703/15526 [1:08:35<3:39:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3703/15526 [1:08:35<3:39:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3704/15526 [1:08:36<3:38:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3704/15526 [1:08:36<3:38:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3705/15526 [1:08:37<3:38:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3705/15526 [1:08:37<3:38:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3706/15526 [1:08:38<3:38:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3706/15526 [1:08:38<3:38:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3707/15526 [1:08:39<3:38:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3707/15526 [1:08:39<3:38:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3708/15526 [1:08:40<3:38:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3708/15526 [1:08:40<3:38:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3709/15526 [1:08:41<3:38:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3709/15526 [1:08:41<3:38:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3710/15526 [1:08:42<3:38:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3710/15526 [1:08:42<3:38:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3711/15526 [1:08:43<3:38:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3711/15526 [1:08:43<3:38:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3712/15526 [1:08:50<3:39:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3712/15526 [1:08:50<3:39:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3713/15526 [1:08:51<3:39:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3713/15526 [1:08:51<3:39:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3714/15526 [1:08:51<3:39:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3714/15526 [1:08:51<3:39:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3715/15526 [1:08:52<3:38:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3715/15526 [1:08:52<3:38:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3716/15526 [1:08:53<3:38:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3716/15526 [1:08:53<3:38:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3717/15526 [1:08:54<3:38:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3717/15526 [1:08:54<3:38:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3718/15526 [1:08:54<3:38:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3718/15526 [1:08:54<3:38:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3719/15526 [1:08:55<3:38:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3719/15526 [1:08:55<3:38:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3720/15526 [1:08:56<3:38:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3720/15526 [1:08:56<3:38:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3721/15526 [1:08:57<3:38:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3721/15526 [1:08:57<3:38:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3722/15526 [1:08:58<3:38:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3722/15526 [1:08:58<3:38:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3723/15526 [1:08:59<3:38:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3723/15526 [1:08:59<3:38:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3724/15526 [1:09:00<3:38:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3724/15526 [1:09:00<3:38:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3725/15526 [1:09:01<3:38:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3725/15526 [1:09:01<3:38:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3726/15526 [1:09:01<3:38:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3726/15526 [1:09:01<3:38:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3727/15526 [1:09:02<3:38:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3727/15526 [1:09:02<3:38:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3728/15526 [1:09:03<3:38:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3728/15526 [1:09:03<3:38:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3729/15526 [1:09:04<3:38:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3729/15526 [1:09:04<3:38:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3730/15526 [1:09:05<3:38:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3730/15526 [1:09:05<3:38:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3731/15526 [1:09:06<3:38:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3731/15526 [1:09:06<3:38:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3732/15526 [1:09:07<3:38:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3732/15526 [1:09:07<3:38:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3733/15526 [1:09:08<3:38:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3733/15526 [1:09:08<3:38:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3734/15526 [1:09:09<3:38:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3734/15526 [1:09:09<3:38:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3735/15526 [1:09:11<3:38:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3735/15526 [1:09:11<3:38:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3736/15526 [1:09:11<3:38:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3736/15526 [1:09:11<3:38:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3737/15526 [1:09:12<3:38:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3737/15526 [1:09:12<3:38:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3738/15526 [1:09:13<3:38:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3738/15526 [1:09:13<3:38:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3739/15526 [1:09:14<3:38:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3739/15526 [1:09:14<3:38:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3740/15526 [1:09:15<3:38:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3740/15526 [1:09:15<3:38:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3741/15526 [1:09:16<3:38:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3741/15526 [1:09:16<3:38:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3742/15526 [1:09:18<3:38:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3742/15526 [1:09:18<3:38:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3743/15526 [1:09:18<3:38:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3743/15526 [1:09:18<3:38:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3744/15526 [1:09:24<3:38:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3744/15526 [1:09:24<3:38:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3745/15526 [1:09:25<3:38:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3745/15526 [1:09:25<3:38:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3746/15526 [1:09:26<3:38:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3746/15526 [1:09:26<3:38:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3747/15526 [1:09:27<3:38:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3747/15526 [1:09:27<3:38:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3748/15526 [1:09:28<3:38:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3748/15526 [1:09:28<3:38:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3749/15526 [1:09:29<3:38:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3749/15526 [1:09:29<3:38:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3750/15526 [1:09:29<3:38:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3750/15526 [1:09:29<3:38:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3751/15526 [1:09:31<3:38:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3751/15526 [1:09:31<3:38:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3752/15526 [1:09:31<3:38:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3752/15526 [1:09:31<3:38:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3753/15526 [1:09:32<3:38:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3753/15526 [1:09:32<3:38:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3754/15526 [1:09:33<3:38:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3754/15526 [1:09:33<3:38:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3755/15526 [1:09:34<3:38:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3755/15526 [1:09:34<3:38:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3756/15526 [1:09:35<3:38:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3756/15526 [1:09:35<3:38:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3757/15526 [1:09:35<3:38:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3757/15526 [1:09:35<3:38:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3758/15526 [1:09:36<3:37:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3758/15526 [1:09:36<3:37:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3759/15526 [1:09:37<3:37:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3759/15526 [1:09:37<3:37:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3760/15526 [1:09:38<3:37:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3760/15526 [1:09:38<3:37:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3761/15526 [1:09:38<3:37:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3761/15526 [1:09:38<3:37:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3762/15526 [1:09:39<3:37:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3762/15526 [1:09:39<3:37:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3763/15526 [1:09:40<3:37:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3763/15526 [1:09:40<3:37:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3764/15526 [1:09:41<3:37:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3764/15526 [1:09:41<3:37:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3765/15526 [1:09:42<3:37:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3765/15526 [1:09:42<3:37:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3766/15526 [1:09:42<3:37:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3766/15526 [1:09:42<3:37:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3767/15526 [1:09:43<3:37:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3767/15526 [1:09:43<3:37:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3768/15526 [1:09:44<3:37:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3768/15526 [1:09:44<3:37:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3769/15526 [1:09:45<3:37:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3769/15526 [1:09:45<3:37:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3770/15526 [1:09:46<3:37:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3770/15526 [1:09:46<3:37:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3771/15526 [1:09:47<3:37:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3771/15526 [1:09:47<3:37:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3772/15526 [1:09:48<3:37:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3772/15526 [1:09:48<3:37:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3773/15526 [1:09:49<3:37:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3773/15526 [1:09:49<3:37:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3774/15526 [1:09:50<3:37:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3774/15526 [1:09:50<3:37:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3775/15526 [1:09:51<3:37:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3775/15526 [1:09:51<3:37:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3776/15526 [1:09:58<3:37:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3776/15526 [1:09:58<3:37:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3777/15526 [1:09:59<3:37:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3777/15526 [1:09:59<3:37:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3778/15526 [1:10:00<3:37:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3778/15526 [1:10:00<3:37:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3779/15526 [1:10:01<3:37:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3779/15526 [1:10:01<3:37:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3780/15526 [1:10:02<3:37:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3780/15526 [1:10:02<3:37:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3781/15526 [1:10:03<3:37:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3781/15526 [1:10:03<3:37:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3782/15526 [1:10:04<3:37:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3782/15526 [1:10:04<3:37:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3783/15526 [1:10:05<3:37:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3783/15526 [1:10:05<3:37:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3784/15526 [1:10:06<3:37:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3784/15526 [1:10:06<3:37:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3785/15526 [1:10:07<3:37:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3785/15526 [1:10:07<3:37:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3786/15526 [1:10:08<3:37:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3786/15526 [1:10:08<3:37:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3787/15526 [1:10:08<3:37:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3787/15526 [1:10:08<3:37:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3788/15526 [1:10:09<3:37:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3788/15526 [1:10:09<3:37:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3789/15526 [1:10:10<3:37:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3789/15526 [1:10:10<3:37:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3790/15526 [1:10:11<3:37:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3790/15526 [1:10:11<3:37:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3791/15526 [1:10:12<3:37:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3791/15526 [1:10:12<3:37:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3792/15526 [1:10:13<3:37:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3792/15526 [1:10:13<3:37:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3793/15526 [1:10:13<3:37:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3793/15526 [1:10:13<3:37:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3794/15526 [1:10:15<3:37:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3794/15526 [1:10:15<3:37:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3795/15526 [1:10:16<3:37:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3795/15526 [1:10:16<3:37:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3796/15526 [1:10:17<3:37:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3796/15526 [1:10:17<3:37:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3797/15526 [1:10:18<3:37:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3797/15526 [1:10:18<3:37:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3798/15526 [1:10:19<3:37:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3798/15526 [1:10:19<3:37:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3799/15526 [1:10:20<3:37:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3799/15526 [1:10:20<3:37:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3800/15526 [1:10:21<3:37:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3800/15526 [1:10:21<3:37:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3801/15526 [1:10:22<3:37:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3801/15526 [1:10:22<3:37:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3802/15526 [1:10:23<3:37:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3802/15526 [1:10:23<3:37:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 3803/15526 [1:10:24<3:37:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  24%|▏| 3803/15526 [1:10:24<3:37:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3804/15526 [1:10:25<3:37:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3804/15526 [1:10:25<3:37:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3805/15526 [1:10:26<3:36:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3805/15526 [1:10:26<3:36:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3806/15526 [1:10:27<3:36:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3806/15526 [1:10:27<3:36:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3807/15526 [1:10:28<3:36:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3807/15526 [1:10:28<3:36:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3808/15526 [1:10:34<3:37:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3808/15526 [1:10:34<3:37:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3809/15526 [1:10:35<3:37:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3809/15526 [1:10:35<3:37:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3810/15526 [1:10:36<3:37:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3810/15526 [1:10:36<3:37:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3811/15526 [1:10:37<3:37:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3811/15526 [1:10:37<3:37:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3812/15526 [1:10:38<3:37:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3812/15526 [1:10:38<3:37:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3813/15526 [1:10:39<3:37:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3813/15526 [1:10:39<3:37:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3814/15526 [1:10:40<3:37:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3814/15526 [1:10:40<3:37:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3815/15526 [1:10:41<3:37:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3815/15526 [1:10:41<3:37:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3816/15526 [1:10:42<3:36:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3816/15526 [1:10:42<3:36:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3817/15526 [1:10:43<3:36:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3817/15526 [1:10:43<3:36:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3818/15526 [1:10:43<3:36:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3818/15526 [1:10:43<3:36:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3819/15526 [1:10:44<3:36:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3819/15526 [1:10:44<3:36:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3820/15526 [1:10:45<3:36:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3820/15526 [1:10:45<3:36:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3821/15526 [1:10:46<3:36:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3821/15526 [1:10:46<3:36:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3822/15526 [1:10:47<3:36:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3822/15526 [1:10:47<3:36:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3823/15526 [1:10:47<3:36:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3823/15526 [1:10:47<3:36:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3824/15526 [1:10:48<3:36:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3824/15526 [1:10:48<3:36:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3825/15526 [1:10:49<3:36:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3825/15526 [1:10:49<3:36:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3826/15526 [1:10:50<3:36:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3826/15526 [1:10:50<3:36:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3827/15526 [1:10:51<3:36:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3827/15526 [1:10:51<3:36:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3828/15526 [1:10:52<3:36:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3828/15526 [1:10:52<3:36:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3829/15526 [1:10:52<3:36:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3829/15526 [1:10:52<3:36:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3830/15526 [1:10:53<3:36:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3830/15526 [1:10:53<3:36:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3831/15526 [1:10:54<3:36:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3831/15526 [1:10:54<3:36:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3832/15526 [1:10:55<3:36:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3832/15526 [1:10:55<3:36:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3833/15526 [1:10:56<3:36:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3833/15526 [1:10:56<3:36:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3834/15526 [1:10:57<3:36:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3834/15526 [1:10:57<3:36:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3835/15526 [1:10:58<3:36:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3835/15526 [1:10:58<3:36:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3836/15526 [1:10:59<3:36:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3836/15526 [1:10:59<3:36:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3837/15526 [1:11:00<3:36:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3837/15526 [1:11:00<3:36:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3838/15526 [1:11:00<3:36:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3838/15526 [1:11:00<3:36:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3839/15526 [1:11:02<3:36:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3839/15526 [1:11:02<3:36:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3840/15526 [1:11:09<3:36:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3840/15526 [1:11:09<3:36:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3841/15526 [1:11:09<3:36:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3841/15526 [1:11:09<3:36:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3842/15526 [1:11:11<3:36:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3842/15526 [1:11:11<3:36:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3843/15526 [1:11:11<3:36:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3843/15526 [1:11:11<3:36:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3844/15526 [1:11:12<3:36:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3844/15526 [1:11:12<3:36:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3845/15526 [1:11:13<3:36:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3845/15526 [1:11:13<3:36:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3846/15526 [1:11:14<3:36:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3846/15526 [1:11:14<3:36:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3847/15526 [1:11:15<3:36:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3847/15526 [1:11:15<3:36:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3848/15526 [1:11:16<3:36:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3848/15526 [1:11:16<3:36:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3849/15526 [1:11:16<3:36:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3849/15526 [1:11:16<3:36:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3850/15526 [1:11:17<3:36:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3850/15526 [1:11:17<3:36:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3851/15526 [1:11:18<3:36:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3851/15526 [1:11:18<3:36:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3852/15526 [1:11:19<3:36:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3852/15526 [1:11:19<3:36:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3853/15526 [1:11:20<3:36:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3853/15526 [1:11:20<3:36:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3854/15526 [1:11:21<3:36:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3854/15526 [1:11:21<3:36:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3855/15526 [1:11:23<3:36:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3855/15526 [1:11:23<3:36:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3856/15526 [1:11:23<3:36:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3856/15526 [1:11:23<3:36:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3857/15526 [1:11:24<3:36:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3857/15526 [1:11:24<3:36:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3858/15526 [1:11:25<3:36:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3858/15526 [1:11:25<3:36:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3859/15526 [1:11:26<3:35:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3859/15526 [1:11:26<3:35:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3860/15526 [1:11:27<3:35:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3860/15526 [1:11:27<3:35:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3861/15526 [1:11:28<3:35:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3861/15526 [1:11:28<3:35:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3862/15526 [1:11:29<3:35:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3862/15526 [1:11:29<3:35:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3863/15526 [1:11:30<3:35:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3863/15526 [1:11:30<3:35:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3864/15526 [1:11:30<3:35:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3864/15526 [1:11:30<3:35:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3865/15526 [1:11:31<3:35:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3865/15526 [1:11:31<3:35:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3866/15526 [1:11:32<3:35:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3866/15526 [1:11:32<3:35:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3867/15526 [1:11:33<3:35:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3867/15526 [1:11:33<3:35:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3868/15526 [1:11:34<3:35:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3868/15526 [1:11:34<3:35:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3869/15526 [1:11:35<3:35:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3869/15526 [1:11:35<3:35:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3870/15526 [1:11:36<3:35:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3870/15526 [1:11:36<3:35:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3871/15526 [1:11:37<3:35:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3871/15526 [1:11:37<3:35:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3872/15526 [1:11:43<3:35:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3872/15526 [1:11:43<3:35:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3873/15526 [1:11:44<3:35:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3873/15526 [1:11:44<3:35:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3874/15526 [1:11:44<3:35:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3874/15526 [1:11:44<3:35:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3875/15526 [1:11:45<3:35:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3875/15526 [1:11:45<3:35:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3876/15526 [1:11:46<3:35:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3876/15526 [1:11:46<3:35:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3877/15526 [1:11:46<3:35:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3877/15526 [1:11:46<3:35:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3878/15526 [1:11:47<3:35:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3878/15526 [1:11:47<3:35:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3879/15526 [1:11:48<3:35:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3879/15526 [1:11:48<3:35:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3880/15526 [1:11:48<3:35:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3880/15526 [1:11:48<3:35:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 3881/15526 [1:11:49<3:35:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▏| 3881/15526 [1:11:49<3:35:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3882/15526 [1:11:50<3:35:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3882/15526 [1:11:50<3:35:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3883/15526 [1:11:50<3:35:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3883/15526 [1:11:50<3:35:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3884/15526 [1:11:51<3:35:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3884/15526 [1:11:51<3:35:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3885/15526 [1:11:52<3:35:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3885/15526 [1:11:52<3:35:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3886/15526 [1:11:52<3:35:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3886/15526 [1:11:52<3:35:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3887/15526 [1:11:53<3:35:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3887/15526 [1:11:53<3:35:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3888/15526 [1:11:54<3:35:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3888/15526 [1:11:54<3:35:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3889/15526 [1:11:55<3:35:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3889/15526 [1:11:55<3:35:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3890/15526 [1:11:56<3:35:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3890/15526 [1:11:56<3:35:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3891/15526 [1:11:57<3:35:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3891/15526 [1:11:57<3:35:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3892/15526 [1:11:58<3:35:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3892/15526 [1:11:58<3:35:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3893/15526 [1:11:58<3:35:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3893/15526 [1:11:58<3:35:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3894/15526 [1:11:59<3:35:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3894/15526 [1:11:59<3:35:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3895/15526 [1:12:00<3:35:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3895/15526 [1:12:00<3:35:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3896/15526 [1:12:01<3:34:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3896/15526 [1:12:01<3:34:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3897/15526 [1:12:02<3:34:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3897/15526 [1:12:02<3:34:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3898/15526 [1:12:03<3:34:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3898/15526 [1:12:03<3:34:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3899/15526 [1:12:03<3:34:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3899/15526 [1:12:03<3:34:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3900/15526 [1:12:04<3:34:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3900/15526 [1:12:04<3:34:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3901/15526 [1:12:05<3:34:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3901/15526 [1:12:05<3:34:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3902/15526 [1:12:05<3:34:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3902/15526 [1:12:05<3:34:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3903/15526 [1:12:06<3:34:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3903/15526 [1:12:06<3:34:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3904/15526 [1:12:17<3:35:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3904/15526 [1:12:17<3:35:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3905/15526 [1:12:18<3:35:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3905/15526 [1:12:18<3:35:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3906/15526 [1:12:19<3:35:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3906/15526 [1:12:19<3:35:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3907/15526 [1:12:20<3:35:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3907/15526 [1:12:20<3:35:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3908/15526 [1:12:21<3:35:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3908/15526 [1:12:21<3:35:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3909/15526 [1:12:21<3:35:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3909/15526 [1:12:21<3:35:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3910/15526 [1:12:23<3:35:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3910/15526 [1:12:23<3:35:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3911/15526 [1:12:24<3:35:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3911/15526 [1:12:24<3:35:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3912/15526 [1:12:25<3:35:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3912/15526 [1:12:25<3:35:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3913/15526 [1:12:26<3:34:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3913/15526 [1:12:26<3:34:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3914/15526 [1:12:26<3:34:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3914/15526 [1:12:26<3:34:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3915/15526 [1:12:27<3:34:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3915/15526 [1:12:27<3:34:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3916/15526 [1:12:28<3:34:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3916/15526 [1:12:28<3:34:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3917/15526 [1:12:29<3:34:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3917/15526 [1:12:29<3:34:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3918/15526 [1:12:30<3:34:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3918/15526 [1:12:30<3:34:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3919/15526 [1:12:30<3:34:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3919/15526 [1:12:30<3:34:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3920/15526 [1:12:32<3:34:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3920/15526 [1:12:32<3:34:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3921/15526 [1:12:32<3:34:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3921/15526 [1:12:32<3:34:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3922/15526 [1:12:33<3:34:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3922/15526 [1:12:33<3:34:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3923/15526 [1:12:34<3:34:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3923/15526 [1:12:34<3:34:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3924/15526 [1:12:34<3:34:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3924/15526 [1:12:34<3:34:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3925/15526 [1:12:35<3:34:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3925/15526 [1:12:35<3:34:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3926/15526 [1:12:36<3:34:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3926/15526 [1:12:36<3:34:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3927/15526 [1:12:37<3:34:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3927/15526 [1:12:37<3:34:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3928/15526 [1:12:37<3:34:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3928/15526 [1:12:37<3:34:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3929/15526 [1:12:38<3:34:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3929/15526 [1:12:38<3:34:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3930/15526 [1:12:39<3:34:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3930/15526 [1:12:39<3:34:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3931/15526 [1:12:40<3:34:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3931/15526 [1:12:40<3:34:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3932/15526 [1:12:41<3:34:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3932/15526 [1:12:41<3:34:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3933/15526 [1:12:41<3:34:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3933/15526 [1:12:41<3:34:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3934/15526 [1:12:42<3:34:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3934/15526 [1:12:42<3:34:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3935/15526 [1:12:43<3:34:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3935/15526 [1:12:43<3:34:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3936/15526 [1:12:52<3:34:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3936/15526 [1:12:52<3:34:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3937/15526 [1:12:52<3:34:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3937/15526 [1:12:52<3:34:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3938/15526 [1:12:54<3:34:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3938/15526 [1:12:54<3:34:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3939/15526 [1:12:55<3:34:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3939/15526 [1:12:55<3:34:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3940/15526 [1:12:55<3:34:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3940/15526 [1:12:55<3:34:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3941/15526 [1:12:57<3:34:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3941/15526 [1:12:57<3:34:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3942/15526 [1:12:58<3:34:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3942/15526 [1:12:58<3:34:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3943/15526 [1:12:59<3:34:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3943/15526 [1:12:59<3:34:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3944/15526 [1:13:00<3:34:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3944/15526 [1:13:00<3:34:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3945/15526 [1:13:00<3:34:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3945/15526 [1:13:00<3:34:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3946/15526 [1:13:01<3:34:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3946/15526 [1:13:01<3:34:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3947/15526 [1:13:02<3:34:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3947/15526 [1:13:02<3:34:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3948/15526 [1:13:03<3:34:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3948/15526 [1:13:03<3:34:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3949/15526 [1:13:03<3:34:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3949/15526 [1:13:03<3:34:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3950/15526 [1:13:04<3:34:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3950/15526 [1:13:04<3:34:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3951/15526 [1:13:05<3:34:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3951/15526 [1:13:05<3:34:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3952/15526 [1:13:06<3:34:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3952/15526 [1:13:06<3:34:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3953/15526 [1:13:07<3:34:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3953/15526 [1:13:07<3:34:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3954/15526 [1:13:07<3:34:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3954/15526 [1:13:07<3:34:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3955/15526 [1:13:08<3:34:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3955/15526 [1:13:08<3:34:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3956/15526 [1:13:10<3:33:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3956/15526 [1:13:10<3:33:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3957/15526 [1:13:10<3:33:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3957/15526 [1:13:10<3:33:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3958/15526 [1:13:11<3:33:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3958/15526 [1:13:11<3:33:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 3959/15526 [1:13:12<3:33:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  25%|▎| 3959/15526 [1:13:12<3:33:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3960/15526 [1:13:13<3:33:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3960/15526 [1:13:13<3:33:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3961/15526 [1:13:14<3:33:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3961/15526 [1:13:14<3:33:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3962/15526 [1:13:15<3:33:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3962/15526 [1:13:15<3:33:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3963/15526 [1:13:16<3:33:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3963/15526 [1:13:16<3:33:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3964/15526 [1:13:17<3:33:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3964/15526 [1:13:17<3:33:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3965/15526 [1:13:17<3:33:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3965/15526 [1:13:17<3:33:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3966/15526 [1:13:18<3:33:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3966/15526 [1:13:18<3:33:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3967/15526 [1:13:19<3:33:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3967/15526 [1:13:19<3:33:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3968/15526 [1:13:25<3:33:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3968/15526 [1:13:25<3:33:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3969/15526 [1:13:26<3:33:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3969/15526 [1:13:26<3:33:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3970/15526 [1:13:27<3:33:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3970/15526 [1:13:27<3:33:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3971/15526 [1:13:28<3:33:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3971/15526 [1:13:28<3:33:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3972/15526 [1:13:29<3:33:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3972/15526 [1:13:29<3:33:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3973/15526 [1:13:29<3:33:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3973/15526 [1:13:29<3:33:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3974/15526 [1:13:31<3:33:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3974/15526 [1:13:31<3:33:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3975/15526 [1:13:31<3:33:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3975/15526 [1:13:31<3:33:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3976/15526 [1:13:32<3:33:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3976/15526 [1:13:32<3:33:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3977/15526 [1:13:33<3:33:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3977/15526 [1:13:33<3:33:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3978/15526 [1:13:34<3:33:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3978/15526 [1:13:34<3:33:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3979/15526 [1:13:34<3:33:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3979/15526 [1:13:34<3:33:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3980/15526 [1:13:35<3:33:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3980/15526 [1:13:35<3:33:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3981/15526 [1:13:36<3:33:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3981/15526 [1:13:36<3:33:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3982/15526 [1:13:37<3:33:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3982/15526 [1:13:37<3:33:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3983/15526 [1:13:37<3:33:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3983/15526 [1:13:37<3:33:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3984/15526 [1:13:38<3:33:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3984/15526 [1:13:38<3:33:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3985/15526 [1:13:39<3:33:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3985/15526 [1:13:39<3:33:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3986/15526 [1:13:40<3:33:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3986/15526 [1:13:40<3:33:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3987/15526 [1:13:41<3:33:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3987/15526 [1:13:41<3:33:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3988/15526 [1:13:42<3:33:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3988/15526 [1:13:42<3:33:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3989/15526 [1:13:43<3:33:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3989/15526 [1:13:43<3:33:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3990/15526 [1:13:45<3:33:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3990/15526 [1:13:45<3:33:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3991/15526 [1:13:45<3:33:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3991/15526 [1:13:45<3:33:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3992/15526 [1:13:47<3:33:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3992/15526 [1:13:47<3:33:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3993/15526 [1:13:48<3:33:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3993/15526 [1:13:48<3:33:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3994/15526 [1:13:49<3:33:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3994/15526 [1:13:49<3:33:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3995/15526 [1:13:50<3:33:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3995/15526 [1:13:50<3:33:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3996/15526 [1:13:50<3:33:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3996/15526 [1:13:50<3:33:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3997/15526 [1:13:51<3:33:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3997/15526 [1:13:51<3:33:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3998/15526 [1:13:52<3:33:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3998/15526 [1:13:52<3:33:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 3999/15526 [1:13:53<3:33:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 3999/15526 [1:13:53<3:33:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4000/15526 [1:14:00<3:33:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4000/15526 [1:14:00<3:33:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4001/15526 [1:14:23<3:34:17,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4001/15526 [1:14:23<3:34:17,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4002/15526 [1:14:24<3:34:15,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4002/15526 [1:14:24<3:34:15,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4003/15526 [1:14:25<3:34:12,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4003/15526 [1:14:25<3:34:12,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4004/15526 [1:14:26<3:34:12,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4004/15526 [1:14:26<3:34:12,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4005/15526 [1:14:26<3:34:09,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4005/15526 [1:14:26<3:34:09,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4006/15526 [1:14:27<3:34:07,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4006/15526 [1:14:27<3:34:07,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4007/15526 [1:14:28<3:34:05,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4007/15526 [1:14:28<3:34:05,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4008/15526 [1:14:29<3:34:02,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4008/15526 [1:14:29<3:34:02,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4009/15526 [1:14:29<3:34:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4009/15526 [1:14:29<3:34:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4010/15526 [1:14:30<3:33:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4010/15526 [1:14:30<3:33:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4011/15526 [1:14:31<3:33:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4011/15526 [1:14:31<3:33:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4012/15526 [1:14:31<3:33:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4012/15526 [1:14:31<3:33:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4013/15526 [1:14:32<3:33:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4013/15526 [1:14:32<3:33:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4014/15526 [1:14:33<3:33:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4014/15526 [1:14:33<3:33:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4015/15526 [1:14:34<3:33:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4015/15526 [1:14:34<3:33:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4016/15526 [1:14:35<3:33:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4016/15526 [1:14:35<3:33:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4017/15526 [1:14:35<3:33:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4017/15526 [1:14:35<3:33:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4018/15526 [1:14:36<3:33:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4018/15526 [1:14:36<3:33:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4019/15526 [1:14:37<3:33:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4019/15526 [1:14:37<3:33:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4020/15526 [1:14:38<3:33:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4020/15526 [1:14:38<3:33:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4021/15526 [1:14:40<3:33:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4021/15526 [1:14:40<3:33:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4022/15526 [1:14:41<3:33:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4022/15526 [1:14:41<3:33:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4023/15526 [1:14:42<3:33:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4023/15526 [1:14:42<3:33:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4024/15526 [1:14:43<3:33:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4024/15526 [1:14:43<3:33:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4025/15526 [1:14:43<3:33:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4025/15526 [1:14:43<3:33:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4026/15526 [1:14:44<3:33:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4026/15526 [1:14:44<3:33:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4027/15526 [1:14:45<3:33:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4027/15526 [1:14:45<3:33:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4028/15526 [1:14:45<3:33:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4028/15526 [1:14:45<3:33:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4029/15526 [1:14:46<3:33:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4029/15526 [1:14:46<3:33:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4030/15526 [1:14:47<3:33:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4030/15526 [1:14:47<3:33:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4031/15526 [1:14:48<3:33:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4031/15526 [1:14:48<3:33:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4032/15526 [1:14:58<3:33:43,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4032/15526 [1:14:58<3:33:43,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4033/15526 [1:14:58<3:33:40,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4033/15526 [1:14:58<3:33:40,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4034/15526 [1:14:59<3:33:38,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4034/15526 [1:14:59<3:33:38,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4035/15526 [1:15:00<3:33:37,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4035/15526 [1:15:00<3:33:37,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4036/15526 [1:15:01<3:33:35,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4036/15526 [1:15:01<3:33:35,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4037/15526 [1:15:02<3:33:34,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4037/15526 [1:15:02<3:33:34,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4038/15526 [1:15:03<3:33:33,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4038/15526 [1:15:03<3:33:33,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4039/15526 [1:15:04<3:33:31,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4039/15526 [1:15:04<3:33:31,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4040/15526 [1:15:05<3:33:28,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4040/15526 [1:15:05<3:33:28,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4041/15526 [1:15:05<3:33:26,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4041/15526 [1:15:05<3:33:26,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4042/15526 [1:15:07<3:33:25,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4042/15526 [1:15:07<3:33:25,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4043/15526 [1:15:07<3:33:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4043/15526 [1:15:07<3:33:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4044/15526 [1:15:09<3:33:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4044/15526 [1:15:09<3:33:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4045/15526 [1:15:09<3:33:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4045/15526 [1:15:09<3:33:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4046/15526 [1:15:10<3:33:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4046/15526 [1:15:10<3:33:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4047/15526 [1:15:11<3:33:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4047/15526 [1:15:11<3:33:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4048/15526 [1:15:12<3:33:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4048/15526 [1:15:12<3:33:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4049/15526 [1:15:13<3:33:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4049/15526 [1:15:13<3:33:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4050/15526 [1:15:14<3:33:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4050/15526 [1:15:14<3:33:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4051/15526 [1:15:14<3:33:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4051/15526 [1:15:14<3:33:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4052/15526 [1:15:15<3:33:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4052/15526 [1:15:15<3:33:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4053/15526 [1:15:17<3:33:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4053/15526 [1:15:17<3:33:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4054/15526 [1:15:17<3:33:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4054/15526 [1:15:17<3:33:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4055/15526 [1:15:19<3:33:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4055/15526 [1:15:19<3:33:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4056/15526 [1:15:19<3:33:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4056/15526 [1:15:19<3:33:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4057/15526 [1:15:20<3:32:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4057/15526 [1:15:20<3:32:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4058/15526 [1:15:21<3:32:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4058/15526 [1:15:21<3:32:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4059/15526 [1:15:22<3:32:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4059/15526 [1:15:22<3:32:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4060/15526 [1:15:22<3:32:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4060/15526 [1:15:22<3:32:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4061/15526 [1:15:23<3:32:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4061/15526 [1:15:23<3:32:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4062/15526 [1:15:24<3:32:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4062/15526 [1:15:24<3:32:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4063/15526 [1:15:24<3:32:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4063/15526 [1:15:24<3:32:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4064/15526 [1:15:31<3:32:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4064/15526 [1:15:31<3:32:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4065/15526 [1:15:32<3:32:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4065/15526 [1:15:32<3:32:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4066/15526 [1:15:33<3:32:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4066/15526 [1:15:33<3:32:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4067/15526 [1:15:33<3:32:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4067/15526 [1:15:33<3:32:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4068/15526 [1:15:34<3:32:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4068/15526 [1:15:34<3:32:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4069/15526 [1:15:36<3:32:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4069/15526 [1:15:36<3:32:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4070/15526 [1:15:36<3:32:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4070/15526 [1:15:36<3:32:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4071/15526 [1:15:37<3:32:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4071/15526 [1:15:37<3:32:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4072/15526 [1:15:38<3:32:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4072/15526 [1:15:38<3:32:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4073/15526 [1:15:38<3:32:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4073/15526 [1:15:38<3:32:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4074/15526 [1:15:39<3:32:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4074/15526 [1:15:39<3:32:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4075/15526 [1:15:40<3:32:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4075/15526 [1:15:40<3:32:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4076/15526 [1:15:41<3:32:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4076/15526 [1:15:41<3:32:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4077/15526 [1:15:42<3:32:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4077/15526 [1:15:42<3:32:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4078/15526 [1:15:42<3:32:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4078/15526 [1:15:42<3:32:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4079/15526 [1:15:43<3:32:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4079/15526 [1:15:43<3:32:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4080/15526 [1:15:45<3:32:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4080/15526 [1:15:45<3:32:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4081/15526 [1:15:45<3:32:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4081/15526 [1:15:45<3:32:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4082/15526 [1:15:46<3:32:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4082/15526 [1:15:46<3:32:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4083/15526 [1:15:47<3:32:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4083/15526 [1:15:47<3:32:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4084/15526 [1:15:48<3:32:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4084/15526 [1:15:48<3:32:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4085/15526 [1:15:49<3:32:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4085/15526 [1:15:49<3:32:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4086/15526 [1:15:49<3:32:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4086/15526 [1:15:49<3:32:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4087/15526 [1:15:50<3:32:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4087/15526 [1:15:50<3:32:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4088/15526 [1:15:51<3:32:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4088/15526 [1:15:51<3:32:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4089/15526 [1:15:51<3:32:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4089/15526 [1:15:51<3:32:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4090/15526 [1:15:52<3:32:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4090/15526 [1:15:52<3:32:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4091/15526 [1:15:53<3:32:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4091/15526 [1:15:53<3:32:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4092/15526 [1:15:54<3:32:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4092/15526 [1:15:54<3:32:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4093/15526 [1:15:55<3:32:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4093/15526 [1:15:55<3:32:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4094/15526 [1:15:56<3:32:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4094/15526 [1:15:56<3:32:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4095/15526 [1:15:57<3:32:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4095/15526 [1:15:57<3:32:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4096/15526 [1:16:06<3:32:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4096/15526 [1:16:06<3:32:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4097/15526 [1:16:06<3:32:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4097/15526 [1:16:06<3:32:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4098/15526 [1:16:08<3:32:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4098/15526 [1:16:08<3:32:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4099/15526 [1:16:08<3:32:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4099/15526 [1:16:08<3:32:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4100/15526 [1:16:09<3:32:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4100/15526 [1:16:09<3:32:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4101/15526 [1:16:10<3:32:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4101/15526 [1:16:10<3:32:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4102/15526 [1:16:11<3:32:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4102/15526 [1:16:11<3:32:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4103/15526 [1:16:12<3:32:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4103/15526 [1:16:12<3:32:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4104/15526 [1:16:12<3:32:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4104/15526 [1:16:12<3:32:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4105/15526 [1:16:13<3:32:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4105/15526 [1:16:13<3:32:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4106/15526 [1:16:14<3:32:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4106/15526 [1:16:14<3:32:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4107/15526 [1:16:15<3:32:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4107/15526 [1:16:15<3:32:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4108/15526 [1:16:16<3:32:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4108/15526 [1:16:16<3:32:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4109/15526 [1:16:17<3:31:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4109/15526 [1:16:17<3:31:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4110/15526 [1:16:18<3:31:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4110/15526 [1:16:18<3:31:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4111/15526 [1:16:19<3:31:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4111/15526 [1:16:19<3:31:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4112/15526 [1:16:20<3:31:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4112/15526 [1:16:20<3:31:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4113/15526 [1:16:21<3:31:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4113/15526 [1:16:21<3:31:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 4114/15526 [1:16:22<3:31:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  26%|▎| 4114/15526 [1:16:22<3:31:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4115/15526 [1:16:23<3:31:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4115/15526 [1:16:23<3:31:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4116/15526 [1:16:24<3:31:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4116/15526 [1:16:24<3:31:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4117/15526 [1:16:25<3:31:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4117/15526 [1:16:25<3:31:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4118/15526 [1:16:26<3:31:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4118/15526 [1:16:26<3:31:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4119/15526 [1:16:27<3:31:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4119/15526 [1:16:27<3:31:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4120/15526 [1:16:27<3:31:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4120/15526 [1:16:27<3:31:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4121/15526 [1:16:28<3:31:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4121/15526 [1:16:28<3:31:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4122/15526 [1:16:29<3:31:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4122/15526 [1:16:29<3:31:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4123/15526 [1:16:30<3:31:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4123/15526 [1:16:30<3:31:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4124/15526 [1:16:30<3:31:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4124/15526 [1:16:30<3:31:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4125/15526 [1:16:32<3:31:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4125/15526 [1:16:32<3:31:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4126/15526 [1:16:33<3:31:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4126/15526 [1:16:33<3:31:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4127/15526 [1:16:34<3:31:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4127/15526 [1:16:34<3:31:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4128/15526 [1:16:40<3:31:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4128/15526 [1:16:40<3:31:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4129/15526 [1:16:41<3:31:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4129/15526 [1:16:41<3:31:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4130/15526 [1:16:42<3:31:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4130/15526 [1:16:42<3:31:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4131/15526 [1:16:43<3:31:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4131/15526 [1:16:43<3:31:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4132/15526 [1:16:44<3:31:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4132/15526 [1:16:44<3:31:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4133/15526 [1:16:45<3:31:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4133/15526 [1:16:45<3:31:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4134/15526 [1:16:46<3:31:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4134/15526 [1:16:46<3:31:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4135/15526 [1:16:47<3:31:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4135/15526 [1:16:47<3:31:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4136/15526 [1:16:47<3:31:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4136/15526 [1:16:47<3:31:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4137/15526 [1:16:48<3:31:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4137/15526 [1:16:48<3:31:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4138/15526 [1:16:49<3:31:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4138/15526 [1:16:49<3:31:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4139/15526 [1:16:49<3:31:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4139/15526 [1:16:49<3:31:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4140/15526 [1:16:50<3:31:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4140/15526 [1:16:50<3:31:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4141/15526 [1:16:51<3:31:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4141/15526 [1:16:51<3:31:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4142/15526 [1:16:51<3:31:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4142/15526 [1:16:51<3:31:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4143/15526 [1:16:52<3:31:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4143/15526 [1:16:52<3:31:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4144/15526 [1:16:53<3:31:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4144/15526 [1:16:53<3:31:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4145/15526 [1:16:53<3:31:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4145/15526 [1:16:53<3:31:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4146/15526 [1:16:54<3:31:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4146/15526 [1:16:54<3:31:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4147/15526 [1:16:55<3:31:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4147/15526 [1:16:55<3:31:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4148/15526 [1:16:56<3:31:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4148/15526 [1:16:56<3:31:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4149/15526 [1:16:57<3:31:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4149/15526 [1:16:57<3:31:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4150/15526 [1:16:57<3:30:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4150/15526 [1:16:57<3:30:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4151/15526 [1:16:58<3:30:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4151/15526 [1:16:58<3:30:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4152/15526 [1:16:59<3:30:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4152/15526 [1:16:59<3:30:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4153/15526 [1:17:00<3:30:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4153/15526 [1:17:00<3:30:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4154/15526 [1:17:01<3:30:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4154/15526 [1:17:01<3:30:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4155/15526 [1:17:02<3:30:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4155/15526 [1:17:02<3:30:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4156/15526 [1:17:02<3:30:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4156/15526 [1:17:02<3:30:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4157/15526 [1:17:03<3:30:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4157/15526 [1:17:03<3:30:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4158/15526 [1:17:05<3:30:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4158/15526 [1:17:05<3:30:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4159/15526 [1:17:05<3:30:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4159/15526 [1:17:05<3:30:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4160/15526 [1:17:14<3:31:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4160/15526 [1:17:14<3:31:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4161/15526 [1:17:14<3:30:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4161/15526 [1:17:14<3:30:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4162/15526 [1:17:15<3:30:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4162/15526 [1:17:15<3:30:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4163/15526 [1:17:16<3:30:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4163/15526 [1:17:16<3:30:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4164/15526 [1:17:17<3:30:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4164/15526 [1:17:17<3:30:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4165/15526 [1:17:17<3:30:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4165/15526 [1:17:17<3:30:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4166/15526 [1:17:18<3:30:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4166/15526 [1:17:18<3:30:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4167/15526 [1:17:19<3:30:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4167/15526 [1:17:19<3:30:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4168/15526 [1:17:20<3:30:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4168/15526 [1:17:20<3:30:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4169/15526 [1:17:20<3:30:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4169/15526 [1:17:20<3:30:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4170/15526 [1:17:21<3:30:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4170/15526 [1:17:21<3:30:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4171/15526 [1:17:22<3:30:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4171/15526 [1:17:22<3:30:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4172/15526 [1:17:24<3:30:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4172/15526 [1:17:24<3:30:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4173/15526 [1:17:24<3:30:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4173/15526 [1:17:24<3:30:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4174/15526 [1:17:25<3:30:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4174/15526 [1:17:25<3:30:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4175/15526 [1:17:26<3:30:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4175/15526 [1:17:26<3:30:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4176/15526 [1:17:27<3:30:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4176/15526 [1:17:27<3:30:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4177/15526 [1:17:27<3:30:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4177/15526 [1:17:27<3:30:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4178/15526 [1:17:29<3:30:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4178/15526 [1:17:29<3:30:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4179/15526 [1:17:29<3:30:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4179/15526 [1:17:29<3:30:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4180/15526 [1:17:31<3:30:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4180/15526 [1:17:31<3:30:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4181/15526 [1:17:32<3:30:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4181/15526 [1:17:32<3:30:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4182/15526 [1:17:32<3:30:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4182/15526 [1:17:32<3:30:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4183/15526 [1:17:33<3:30:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4183/15526 [1:17:33<3:30:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4184/15526 [1:17:34<3:30:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4184/15526 [1:17:34<3:30:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4185/15526 [1:17:35<3:30:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4185/15526 [1:17:35<3:30:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4186/15526 [1:17:36<3:30:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4186/15526 [1:17:36<3:30:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4187/15526 [1:17:37<3:30:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4187/15526 [1:17:37<3:30:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4188/15526 [1:17:38<3:30:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4188/15526 [1:17:38<3:30:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4189/15526 [1:17:38<3:30:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4189/15526 [1:17:38<3:30:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4190/15526 [1:17:39<3:30:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4190/15526 [1:17:39<3:30:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4191/15526 [1:17:40<3:30:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4191/15526 [1:17:40<3:30:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4192/15526 [1:17:49<3:30:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4192/15526 [1:17:49<3:30:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4193/15526 [1:17:50<3:30:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4193/15526 [1:17:50<3:30:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4194/15526 [1:17:50<3:30:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4194/15526 [1:17:50<3:30:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4195/15526 [1:17:51<3:30:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4195/15526 [1:17:51<3:30:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4196/15526 [1:17:52<3:30:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4196/15526 [1:17:52<3:30:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4197/15526 [1:17:53<3:30:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4197/15526 [1:17:53<3:30:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4198/15526 [1:17:53<3:30:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4198/15526 [1:17:53<3:30:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4199/15526 [1:17:54<3:30:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4199/15526 [1:17:54<3:30:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4200/15526 [1:17:55<3:30:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4200/15526 [1:17:55<3:30:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4201/15526 [1:17:56<3:30:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4201/15526 [1:17:56<3:30:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4202/15526 [1:17:58<3:30:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4202/15526 [1:17:58<3:30:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4203/15526 [1:17:58<3:30:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4203/15526 [1:17:58<3:30:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4204/15526 [1:17:59<3:30:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4204/15526 [1:17:59<3:30:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4205/15526 [1:18:00<3:30:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4205/15526 [1:18:00<3:30:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4206/15526 [1:18:01<3:30:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4206/15526 [1:18:01<3:30:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4207/15526 [1:18:03<3:29:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4207/15526 [1:18:03<3:29:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4208/15526 [1:18:03<3:29:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4208/15526 [1:18:03<3:29:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4209/15526 [1:18:04<3:29:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4209/15526 [1:18:04<3:29:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4210/15526 [1:18:05<3:29:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4210/15526 [1:18:05<3:29:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4211/15526 [1:18:06<3:29:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4211/15526 [1:18:06<3:29:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4212/15526 [1:18:07<3:29:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4212/15526 [1:18:07<3:29:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4213/15526 [1:18:08<3:29:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4213/15526 [1:18:08<3:29:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4214/15526 [1:18:09<3:29:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4214/15526 [1:18:09<3:29:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4215/15526 [1:18:10<3:29:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4215/15526 [1:18:10<3:29:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4216/15526 [1:18:11<3:29:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4216/15526 [1:18:11<3:29:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4217/15526 [1:18:12<3:29:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4217/15526 [1:18:12<3:29:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4218/15526 [1:18:13<3:29:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4218/15526 [1:18:13<3:29:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4219/15526 [1:18:14<3:29:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4219/15526 [1:18:14<3:29:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4220/15526 [1:18:14<3:29:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4220/15526 [1:18:14<3:29:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4221/15526 [1:18:15<3:29:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4221/15526 [1:18:15<3:29:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4222/15526 [1:18:16<3:29:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4222/15526 [1:18:16<3:29:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4223/15526 [1:18:17<3:29:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4223/15526 [1:18:17<3:29:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4224/15526 [1:18:24<3:29:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4224/15526 [1:18:24<3:29:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4225/15526 [1:18:25<3:29:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4225/15526 [1:18:25<3:29:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4226/15526 [1:18:26<3:29:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4226/15526 [1:18:26<3:29:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4227/15526 [1:18:27<3:29:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4227/15526 [1:18:27<3:29:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4228/15526 [1:18:27<3:29:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4228/15526 [1:18:27<3:29:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4229/15526 [1:18:28<3:29:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4229/15526 [1:18:28<3:29:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4230/15526 [1:18:30<3:29:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4230/15526 [1:18:30<3:29:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4231/15526 [1:18:31<3:29:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4231/15526 [1:18:31<3:29:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4232/15526 [1:18:31<3:29:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4232/15526 [1:18:31<3:29:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4233/15526 [1:18:33<3:29:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4233/15526 [1:18:33<3:29:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4234/15526 [1:18:34<3:29:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4234/15526 [1:18:34<3:29:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4235/15526 [1:18:35<3:29:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4235/15526 [1:18:35<3:29:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4236/15526 [1:18:36<3:29:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4236/15526 [1:18:36<3:29:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4237/15526 [1:18:37<3:29:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4237/15526 [1:18:37<3:29:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4238/15526 [1:18:38<3:29:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4238/15526 [1:18:38<3:29:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4239/15526 [1:18:38<3:29:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4239/15526 [1:18:38<3:29:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4240/15526 [1:18:39<3:29:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4240/15526 [1:18:39<3:29:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4241/15526 [1:18:40<3:29:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4241/15526 [1:18:40<3:29:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4242/15526 [1:18:40<3:29:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4242/15526 [1:18:40<3:29:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4243/15526 [1:18:41<3:29:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4243/15526 [1:18:41<3:29:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4244/15526 [1:18:42<3:29:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4244/15526 [1:18:42<3:29:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4245/15526 [1:18:42<3:29:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4245/15526 [1:18:42<3:29:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4246/15526 [1:18:43<3:29:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4246/15526 [1:18:43<3:29:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4247/15526 [1:18:44<3:29:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4247/15526 [1:18:44<3:29:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4248/15526 [1:18:44<3:29:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4248/15526 [1:18:44<3:29:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4249/15526 [1:18:45<3:29:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4249/15526 [1:18:45<3:29:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4250/15526 [1:18:46<3:29:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4250/15526 [1:18:46<3:29:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4251/15526 [1:18:47<3:28:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4251/15526 [1:18:47<3:28:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4252/15526 [1:18:47<3:28:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4252/15526 [1:18:47<3:28:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4253/15526 [1:18:48<3:28:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4253/15526 [1:18:48<3:28:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4254/15526 [1:18:49<3:28:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4254/15526 [1:18:49<3:28:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4255/15526 [1:18:49<3:28:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4255/15526 [1:18:49<3:28:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4256/15526 [1:18:59<3:29:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4256/15526 [1:18:59<3:29:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4257/15526 [1:19:00<3:29:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4257/15526 [1:19:00<3:29:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4258/15526 [1:19:00<3:29:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4258/15526 [1:19:00<3:29:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4259/15526 [1:19:02<3:29:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4259/15526 [1:19:02<3:29:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4260/15526 [1:19:02<3:29:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4260/15526 [1:19:02<3:29:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4261/15526 [1:19:03<3:29:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4261/15526 [1:19:03<3:29:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4262/15526 [1:19:04<3:28:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4262/15526 [1:19:04<3:28:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4263/15526 [1:19:05<3:28:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4263/15526 [1:19:05<3:28:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4264/15526 [1:19:05<3:28:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4264/15526 [1:19:05<3:28:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4265/15526 [1:19:06<3:28:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4265/15526 [1:19:06<3:28:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4266/15526 [1:19:07<3:28:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4266/15526 [1:19:07<3:28:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4267/15526 [1:19:08<3:28:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4267/15526 [1:19:08<3:28:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4268/15526 [1:19:09<3:28:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4268/15526 [1:19:09<3:28:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 4269/15526 [1:19:09<3:28:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  27%|▎| 4269/15526 [1:19:09<3:28:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4270/15526 [1:19:11<3:28:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4270/15526 [1:19:11<3:28:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4271/15526 [1:19:11<3:28:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4271/15526 [1:19:11<3:28:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4272/15526 [1:19:12<3:28:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4272/15526 [1:19:12<3:28:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4273/15526 [1:19:13<3:28:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4273/15526 [1:19:13<3:28:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4274/15526 [1:19:14<3:28:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4274/15526 [1:19:14<3:28:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4275/15526 [1:19:15<3:28:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4275/15526 [1:19:15<3:28:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4276/15526 [1:19:16<3:28:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4276/15526 [1:19:16<3:28:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4277/15526 [1:19:17<3:28:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4277/15526 [1:19:17<3:28:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4278/15526 [1:19:18<3:28:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4278/15526 [1:19:18<3:28:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4279/15526 [1:19:19<3:28:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4279/15526 [1:19:19<3:28:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4280/15526 [1:19:19<3:28:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4280/15526 [1:19:19<3:28:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4281/15526 [1:19:20<3:28:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4281/15526 [1:19:20<3:28:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4282/15526 [1:19:21<3:28:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4282/15526 [1:19:21<3:28:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4283/15526 [1:19:22<3:28:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4283/15526 [1:19:22<3:28:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4284/15526 [1:19:23<3:28:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4284/15526 [1:19:23<3:28:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4285/15526 [1:19:24<3:28:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4285/15526 [1:19:24<3:28:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4286/15526 [1:19:25<3:28:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4286/15526 [1:19:25<3:28:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4287/15526 [1:19:26<3:28:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4287/15526 [1:19:26<3:28:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4288/15526 [1:19:34<3:28:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4288/15526 [1:19:34<3:28:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4289/15526 [1:19:35<3:28:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4289/15526 [1:19:35<3:28:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4290/15526 [1:19:35<3:28:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4290/15526 [1:19:35<3:28:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4291/15526 [1:19:37<3:28:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4291/15526 [1:19:37<3:28:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4292/15526 [1:19:38<3:28:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4292/15526 [1:19:38<3:28:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4293/15526 [1:19:39<3:28:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4293/15526 [1:19:39<3:28:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4294/15526 [1:19:39<3:28:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4294/15526 [1:19:39<3:28:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4295/15526 [1:19:40<3:28:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4295/15526 [1:19:40<3:28:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4296/15526 [1:19:41<3:28:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4296/15526 [1:19:41<3:28:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4297/15526 [1:19:41<3:28:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4297/15526 [1:19:41<3:28:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4298/15526 [1:19:42<3:28:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4298/15526 [1:19:42<3:28:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4299/15526 [1:19:43<3:28:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4299/15526 [1:19:43<3:28:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4300/15526 [1:19:44<3:28:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4300/15526 [1:19:44<3:28:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4301/15526 [1:19:45<3:28:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4301/15526 [1:19:45<3:28:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4302/15526 [1:19:46<3:28:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4302/15526 [1:19:46<3:28:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4303/15526 [1:19:46<3:28:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4303/15526 [1:19:46<3:28:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4304/15526 [1:19:47<3:28:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4304/15526 [1:19:47<3:28:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4305/15526 [1:19:48<3:28:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4305/15526 [1:19:48<3:28:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4306/15526 [1:19:49<3:27:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4306/15526 [1:19:49<3:27:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4307/15526 [1:19:50<3:27:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4307/15526 [1:19:50<3:27:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4308/15526 [1:19:51<3:27:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4308/15526 [1:19:51<3:27:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4309/15526 [1:19:51<3:27:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4309/15526 [1:19:51<3:27:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4310/15526 [1:19:52<3:27:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4310/15526 [1:19:52<3:27:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4311/15526 [1:19:53<3:27:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4311/15526 [1:19:53<3:27:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4312/15526 [1:19:53<3:27:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4312/15526 [1:19:53<3:27:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4313/15526 [1:19:54<3:27:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4313/15526 [1:19:54<3:27:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4314/15526 [1:19:55<3:27:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4314/15526 [1:19:55<3:27:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4315/15526 [1:19:55<3:27:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4315/15526 [1:19:55<3:27:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4316/15526 [1:19:56<3:27:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4316/15526 [1:19:56<3:27:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4317/15526 [1:19:57<3:27:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4317/15526 [1:19:57<3:27:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4318/15526 [1:19:58<3:27:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4318/15526 [1:19:58<3:27:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4319/15526 [1:19:59<3:27:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4319/15526 [1:19:59<3:27:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4320/15526 [1:20:09<3:27:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4320/15526 [1:20:09<3:27:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4321/15526 [1:20:09<3:27:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4321/15526 [1:20:09<3:27:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4322/15526 [1:20:10<3:27:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4322/15526 [1:20:10<3:27:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4323/15526 [1:20:11<3:27:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4323/15526 [1:20:11<3:27:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4324/15526 [1:20:12<3:27:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4324/15526 [1:20:12<3:27:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4325/15526 [1:20:12<3:27:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4325/15526 [1:20:12<3:27:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4326/15526 [1:20:13<3:27:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4326/15526 [1:20:13<3:27:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4327/15526 [1:20:14<3:27:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4327/15526 [1:20:14<3:27:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4328/15526 [1:20:14<3:27:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4328/15526 [1:20:14<3:27:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4329/15526 [1:20:15<3:27:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4329/15526 [1:20:15<3:27:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4330/15526 [1:20:16<3:27:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4330/15526 [1:20:16<3:27:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4331/15526 [1:20:17<3:27:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4331/15526 [1:20:17<3:27:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4332/15526 [1:20:18<3:27:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4332/15526 [1:20:18<3:27:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4333/15526 [1:20:18<3:27:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4333/15526 [1:20:18<3:27:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4334/15526 [1:20:19<3:27:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4334/15526 [1:20:19<3:27:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4335/15526 [1:20:20<3:27:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4335/15526 [1:20:20<3:27:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4336/15526 [1:20:21<3:27:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4336/15526 [1:20:21<3:27:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4337/15526 [1:20:22<3:27:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4337/15526 [1:20:22<3:27:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4338/15526 [1:20:22<3:27:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4338/15526 [1:20:22<3:27:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4339/15526 [1:20:23<3:27:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4339/15526 [1:20:23<3:27:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4340/15526 [1:20:24<3:27:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4340/15526 [1:20:24<3:27:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4341/15526 [1:20:25<3:27:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4341/15526 [1:20:25<3:27:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4342/15526 [1:20:25<3:27:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4342/15526 [1:20:25<3:27:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4343/15526 [1:20:26<3:27:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4343/15526 [1:20:26<3:27:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4344/15526 [1:20:27<3:27:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4344/15526 [1:20:27<3:27:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4345/15526 [1:20:28<3:27:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4345/15526 [1:20:28<3:27:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4346/15526 [1:20:29<3:27:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4346/15526 [1:20:29<3:27:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4347/15526 [1:20:30<3:27:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4347/15526 [1:20:30<3:27:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4348/15526 [1:20:31<3:27:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4348/15526 [1:20:31<3:27:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4349/15526 [1:20:32<3:26:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4349/15526 [1:20:32<3:26:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4350/15526 [1:20:33<3:26:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4350/15526 [1:20:33<3:26:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4351/15526 [1:20:34<3:26:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4351/15526 [1:20:34<3:26:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4352/15526 [1:20:43<3:27:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4352/15526 [1:20:43<3:27:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4353/15526 [1:20:44<3:27:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4353/15526 [1:20:44<3:27:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4354/15526 [1:20:45<3:27:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4354/15526 [1:20:45<3:27:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4355/15526 [1:20:46<3:27:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4355/15526 [1:20:46<3:27:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4356/15526 [1:20:47<3:27:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4356/15526 [1:20:47<3:27:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4357/15526 [1:20:48<3:27:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4357/15526 [1:20:48<3:27:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4358/15526 [1:20:49<3:27:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4358/15526 [1:20:49<3:27:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4359/15526 [1:20:50<3:27:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4359/15526 [1:20:50<3:27:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4360/15526 [1:20:51<3:27:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4360/15526 [1:20:51<3:27:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4361/15526 [1:20:51<3:27:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4361/15526 [1:20:51<3:27:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4362/15526 [1:20:52<3:26:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4362/15526 [1:20:52<3:26:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4363/15526 [1:20:53<3:26:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4363/15526 [1:20:53<3:26:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4364/15526 [1:20:54<3:26:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4364/15526 [1:20:54<3:26:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4365/15526 [1:20:55<3:26:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4365/15526 [1:20:55<3:26:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4366/15526 [1:20:56<3:26:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4366/15526 [1:20:56<3:26:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4367/15526 [1:20:57<3:26:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4367/15526 [1:20:57<3:26:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4368/15526 [1:20:58<3:26:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4368/15526 [1:20:58<3:26:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4369/15526 [1:20:59<3:26:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4369/15526 [1:20:59<3:26:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4370/15526 [1:20:59<3:26:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4370/15526 [1:20:59<3:26:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4371/15526 [1:21:00<3:26:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4371/15526 [1:21:00<3:26:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4372/15526 [1:21:01<3:26:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4372/15526 [1:21:01<3:26:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4373/15526 [1:21:01<3:26:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4373/15526 [1:21:01<3:26:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4374/15526 [1:21:02<3:26:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4374/15526 [1:21:02<3:26:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4375/15526 [1:21:03<3:26:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4375/15526 [1:21:03<3:26:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4376/15526 [1:21:03<3:26:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4376/15526 [1:21:03<3:26:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4377/15526 [1:21:04<3:26:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4377/15526 [1:21:04<3:26:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4378/15526 [1:21:05<3:26:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4378/15526 [1:21:05<3:26:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4379/15526 [1:21:06<3:26:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4379/15526 [1:21:06<3:26:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4380/15526 [1:21:07<3:26:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4380/15526 [1:21:07<3:26:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4381/15526 [1:21:07<3:26:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4381/15526 [1:21:07<3:26:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4382/15526 [1:21:08<3:26:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4382/15526 [1:21:08<3:26:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4383/15526 [1:21:09<3:26:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4383/15526 [1:21:09<3:26:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4384/15526 [1:21:16<3:26:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4384/15526 [1:21:16<3:26:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4385/15526 [1:21:18<3:26:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4385/15526 [1:21:18<3:26:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4386/15526 [1:21:18<3:26:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4386/15526 [1:21:18<3:26:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4387/15526 [1:21:19<3:26:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4387/15526 [1:21:19<3:26:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4388/15526 [1:21:20<3:26:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4388/15526 [1:21:20<3:26:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4389/15526 [1:21:20<3:26:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4389/15526 [1:21:20<3:26:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4390/15526 [1:21:21<3:26:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4390/15526 [1:21:21<3:26:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4391/15526 [1:21:22<3:26:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4391/15526 [1:21:22<3:26:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4392/15526 [1:21:23<3:26:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4392/15526 [1:21:23<3:26:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4393/15526 [1:21:23<3:26:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4393/15526 [1:21:23<3:26:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4394/15526 [1:21:25<3:26:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4394/15526 [1:21:25<3:26:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4395/15526 [1:21:26<3:26:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4395/15526 [1:21:26<3:26:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4396/15526 [1:21:26<3:26:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4396/15526 [1:21:26<3:26:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4397/15526 [1:21:27<3:26:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4397/15526 [1:21:27<3:26:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4398/15526 [1:21:28<3:26:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4398/15526 [1:21:28<3:26:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4399/15526 [1:21:28<3:26:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4399/15526 [1:21:28<3:26:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4400/15526 [1:21:29<3:26:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4400/15526 [1:21:29<3:26:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4401/15526 [1:21:30<3:26:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4401/15526 [1:21:30<3:26:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4402/15526 [1:21:30<3:25:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4402/15526 [1:21:30<3:25:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4403/15526 [1:21:31<3:25:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4403/15526 [1:21:31<3:25:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4404/15526 [1:21:32<3:25:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4404/15526 [1:21:32<3:25:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4405/15526 [1:21:33<3:25:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4405/15526 [1:21:33<3:25:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4406/15526 [1:21:34<3:25:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4406/15526 [1:21:34<3:25:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4407/15526 [1:21:34<3:25:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4407/15526 [1:21:34<3:25:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4408/15526 [1:21:36<3:25:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4408/15526 [1:21:36<3:25:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4409/15526 [1:21:36<3:25:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4409/15526 [1:21:36<3:25:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4410/15526 [1:21:37<3:25:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4410/15526 [1:21:37<3:25:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4411/15526 [1:21:38<3:25:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4411/15526 [1:21:38<3:25:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4412/15526 [1:21:38<3:25:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4412/15526 [1:21:38<3:25:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4413/15526 [1:21:39<3:25:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4413/15526 [1:21:39<3:25:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4414/15526 [1:21:40<3:25:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4414/15526 [1:21:40<3:25:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4415/15526 [1:21:41<3:25:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4415/15526 [1:21:41<3:25:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4416/15526 [1:21:49<3:25:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4416/15526 [1:21:49<3:25:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4417/15526 [1:21:50<3:25:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4417/15526 [1:21:50<3:25:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4418/15526 [1:21:51<3:25:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4418/15526 [1:21:51<3:25:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4419/15526 [1:21:51<3:25:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4419/15526 [1:21:51<3:25:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4420/15526 [1:21:52<3:25:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4420/15526 [1:21:52<3:25:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4421/15526 [1:21:53<3:25:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4421/15526 [1:21:53<3:25:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4422/15526 [1:21:53<3:25:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4422/15526 [1:21:53<3:25:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4423/15526 [1:21:55<3:25:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4423/15526 [1:21:55<3:25:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 4424/15526 [1:21:56<3:25:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  28%|▎| 4424/15526 [1:21:56<3:25:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4425/15526 [1:21:57<3:25:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4425/15526 [1:21:57<3:25:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4426/15526 [1:21:57<3:25:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4426/15526 [1:21:57<3:25:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4427/15526 [1:21:59<3:25:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4427/15526 [1:21:59<3:25:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4428/15526 [1:21:59<3:25:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4428/15526 [1:21:59<3:25:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4429/15526 [1:22:00<3:25:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4429/15526 [1:22:00<3:25:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4430/15526 [1:22:02<3:25:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4430/15526 [1:22:02<3:25:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4431/15526 [1:22:02<3:25:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4431/15526 [1:22:02<3:25:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4432/15526 [1:22:03<3:25:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4432/15526 [1:22:03<3:25:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4433/15526 [1:22:04<3:25:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4433/15526 [1:22:04<3:25:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4434/15526 [1:22:05<3:25:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4434/15526 [1:22:05<3:25:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4435/15526 [1:22:06<3:25:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4435/15526 [1:22:06<3:25:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4436/15526 [1:22:07<3:25:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4436/15526 [1:22:07<3:25:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4437/15526 [1:22:08<3:25:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4437/15526 [1:22:08<3:25:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4438/15526 [1:22:08<3:25:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4438/15526 [1:22:08<3:25:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4439/15526 [1:22:09<3:25:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4439/15526 [1:22:09<3:25:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4440/15526 [1:22:10<3:25:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4440/15526 [1:22:10<3:25:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4441/15526 [1:22:10<3:25:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4441/15526 [1:22:10<3:25:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4442/15526 [1:22:11<3:25:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4442/15526 [1:22:11<3:25:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4443/15526 [1:22:12<3:25:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4443/15526 [1:22:12<3:25:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4444/15526 [1:22:13<3:25:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4444/15526 [1:22:13<3:25:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4445/15526 [1:22:14<3:25:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4445/15526 [1:22:14<3:25:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4446/15526 [1:22:14<3:24:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4446/15526 [1:22:14<3:24:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4447/15526 [1:22:15<3:24:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4447/15526 [1:22:15<3:24:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4448/15526 [1:22:25<3:25:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4448/15526 [1:22:25<3:25:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4449/15526 [1:22:26<3:25:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4449/15526 [1:22:26<3:25:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4450/15526 [1:22:27<3:25:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4450/15526 [1:22:27<3:25:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4451/15526 [1:22:28<3:25:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4451/15526 [1:22:28<3:25:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4452/15526 [1:22:28<3:25:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4452/15526 [1:22:28<3:25:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4453/15526 [1:22:29<3:25:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4453/15526 [1:22:29<3:25:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4454/15526 [1:22:30<3:25:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4454/15526 [1:22:30<3:25:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4455/15526 [1:22:31<3:25:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4455/15526 [1:22:31<3:25:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4456/15526 [1:22:31<3:25:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4456/15526 [1:22:31<3:25:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4457/15526 [1:22:32<3:24:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4457/15526 [1:22:32<3:24:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4458/15526 [1:22:33<3:24:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4458/15526 [1:22:33<3:24:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4459/15526 [1:22:34<3:24:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4459/15526 [1:22:34<3:24:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4460/15526 [1:22:35<3:24:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4460/15526 [1:22:35<3:24:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4461/15526 [1:22:36<3:24:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4461/15526 [1:22:36<3:24:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4462/15526 [1:22:36<3:24:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4462/15526 [1:22:36<3:24:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4463/15526 [1:22:37<3:24:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4463/15526 [1:22:37<3:24:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4464/15526 [1:22:38<3:24:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4464/15526 [1:22:38<3:24:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4465/15526 [1:22:39<3:24:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4465/15526 [1:22:39<3:24:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4466/15526 [1:22:40<3:24:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4466/15526 [1:22:40<3:24:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4467/15526 [1:22:40<3:24:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4467/15526 [1:22:40<3:24:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4468/15526 [1:22:41<3:24:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4468/15526 [1:22:41<3:24:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4469/15526 [1:22:42<3:24:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4469/15526 [1:22:42<3:24:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4470/15526 [1:22:43<3:24:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4470/15526 [1:22:43<3:24:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4471/15526 [1:22:44<3:24:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4471/15526 [1:22:44<3:24:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4472/15526 [1:22:44<3:24:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4472/15526 [1:22:44<3:24:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4473/15526 [1:22:45<3:24:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4473/15526 [1:22:45<3:24:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4474/15526 [1:22:46<3:24:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4474/15526 [1:22:46<3:24:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4475/15526 [1:22:47<3:24:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4475/15526 [1:22:47<3:24:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4476/15526 [1:22:47<3:24:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4476/15526 [1:22:47<3:24:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4477/15526 [1:22:48<3:24:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4477/15526 [1:22:48<3:24:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4478/15526 [1:22:49<3:24:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4478/15526 [1:22:49<3:24:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4479/15526 [1:22:50<3:24:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4479/15526 [1:22:50<3:24:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4480/15526 [1:22:59<3:24:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4480/15526 [1:22:59<3:24:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4481/15526 [1:23:01<3:24:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4481/15526 [1:23:01<3:24:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4482/15526 [1:23:01<3:24:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4482/15526 [1:23:01<3:24:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4483/15526 [1:23:02<3:24:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4483/15526 [1:23:02<3:24:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4484/15526 [1:23:04<3:24:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4484/15526 [1:23:04<3:24:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4485/15526 [1:23:04<3:24:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4485/15526 [1:23:04<3:24:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4486/15526 [1:23:06<3:24:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4486/15526 [1:23:06<3:24:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4487/15526 [1:23:07<3:24:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4487/15526 [1:23:07<3:24:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4488/15526 [1:23:08<3:24:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4488/15526 [1:23:08<3:24:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4489/15526 [1:23:09<3:24:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4489/15526 [1:23:09<3:24:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4490/15526 [1:23:09<3:24:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4490/15526 [1:23:09<3:24:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4491/15526 [1:23:11<3:24:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4491/15526 [1:23:11<3:24:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4492/15526 [1:23:11<3:24:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4492/15526 [1:23:11<3:24:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4493/15526 [1:23:12<3:24:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4493/15526 [1:23:12<3:24:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4494/15526 [1:23:13<3:24:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4494/15526 [1:23:13<3:24:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4495/15526 [1:23:14<3:24:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4495/15526 [1:23:14<3:24:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4496/15526 [1:23:15<3:24:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4496/15526 [1:23:15<3:24:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4497/15526 [1:23:16<3:24:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4497/15526 [1:23:16<3:24:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4498/15526 [1:23:17<3:24:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4498/15526 [1:23:17<3:24:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4499/15526 [1:23:18<3:24:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4499/15526 [1:23:18<3:24:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4500/15526 [1:23:19<3:24:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4500/15526 [1:23:19<3:24:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4501/15526 [1:23:19<3:24:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4501/15526 [1:23:19<3:24:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4502/15526 [1:23:20<3:24:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4502/15526 [1:23:20<3:24:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4503/15526 [1:23:21<3:24:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4503/15526 [1:23:21<3:24:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4504/15526 [1:23:22<3:24:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4504/15526 [1:23:22<3:24:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4505/15526 [1:23:23<3:23:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4505/15526 [1:23:23<3:23:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4506/15526 [1:23:24<3:23:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4506/15526 [1:23:24<3:23:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4507/15526 [1:23:24<3:23:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4507/15526 [1:23:24<3:23:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4508/15526 [1:23:26<3:23:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4508/15526 [1:23:26<3:23:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4509/15526 [1:23:26<3:23:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4509/15526 [1:23:26<3:23:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4510/15526 [1:23:27<3:23:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4510/15526 [1:23:27<3:23:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4511/15526 [1:23:28<3:23:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4511/15526 [1:23:28<3:23:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4512/15526 [1:23:34<3:24:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4512/15526 [1:23:34<3:24:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4513/15526 [1:23:35<3:23:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4513/15526 [1:23:35<3:23:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4514/15526 [1:23:36<3:23:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4514/15526 [1:23:36<3:23:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4515/15526 [1:23:36<3:23:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4515/15526 [1:23:36<3:23:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4516/15526 [1:23:38<3:23:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4516/15526 [1:23:38<3:23:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4517/15526 [1:23:38<3:23:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4517/15526 [1:23:38<3:23:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4518/15526 [1:23:40<3:23:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4518/15526 [1:23:40<3:23:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4519/15526 [1:23:40<3:23:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4519/15526 [1:23:40<3:23:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4520/15526 [1:23:41<3:23:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4520/15526 [1:23:41<3:23:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4521/15526 [1:23:42<3:23:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4521/15526 [1:23:42<3:23:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4522/15526 [1:23:43<3:23:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4522/15526 [1:23:43<3:23:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4523/15526 [1:23:44<3:23:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4523/15526 [1:23:44<3:23:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4524/15526 [1:23:45<3:23:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4524/15526 [1:23:45<3:23:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4525/15526 [1:23:46<3:23:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4525/15526 [1:23:46<3:23:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4526/15526 [1:23:47<3:23:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4526/15526 [1:23:47<3:23:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4527/15526 [1:23:47<3:23:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4527/15526 [1:23:47<3:23:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4528/15526 [1:23:49<3:23:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4528/15526 [1:23:49<3:23:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4529/15526 [1:23:50<3:23:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4529/15526 [1:23:50<3:23:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4530/15526 [1:23:51<3:23:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4530/15526 [1:23:51<3:23:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4531/15526 [1:23:52<3:23:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4531/15526 [1:23:52<3:23:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4532/15526 [1:23:53<3:23:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4532/15526 [1:23:53<3:23:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4533/15526 [1:23:54<3:23:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4533/15526 [1:23:54<3:23:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4534/15526 [1:23:55<3:23:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4534/15526 [1:23:55<3:23:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4535/15526 [1:23:56<3:23:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4535/15526 [1:23:56<3:23:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4536/15526 [1:23:57<3:23:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4536/15526 [1:23:57<3:23:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4537/15526 [1:23:58<3:23:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4537/15526 [1:23:58<3:23:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4538/15526 [1:24:00<3:23:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4538/15526 [1:24:00<3:23:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4539/15526 [1:24:00<3:23:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4539/15526 [1:24:00<3:23:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4540/15526 [1:24:01<3:23:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4540/15526 [1:24:01<3:23:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4541/15526 [1:24:02<3:23:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4541/15526 [1:24:02<3:23:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4542/15526 [1:24:03<3:23:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4542/15526 [1:24:03<3:23:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4543/15526 [1:24:03<3:23:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4543/15526 [1:24:03<3:23:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4544/15526 [1:24:10<3:23:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4544/15526 [1:24:10<3:23:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4545/15526 [1:24:11<3:23:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4545/15526 [1:24:11<3:23:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4546/15526 [1:24:12<3:23:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4546/15526 [1:24:12<3:23:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4547/15526 [1:24:14<3:23:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4547/15526 [1:24:14<3:23:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4548/15526 [1:24:14<3:23:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4548/15526 [1:24:14<3:23:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4549/15526 [1:24:16<3:23:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4549/15526 [1:24:16<3:23:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4550/15526 [1:24:16<3:23:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4550/15526 [1:24:16<3:23:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4551/15526 [1:24:17<3:23:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4551/15526 [1:24:17<3:23:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4552/15526 [1:24:18<3:23:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4552/15526 [1:24:18<3:23:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4553/15526 [1:24:18<3:23:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4553/15526 [1:24:18<3:23:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4554/15526 [1:24:20<3:23:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4554/15526 [1:24:20<3:23:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4555/15526 [1:24:20<3:23:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4555/15526 [1:24:20<3:23:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4556/15526 [1:24:21<3:23:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4556/15526 [1:24:21<3:23:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4557/15526 [1:24:22<3:23:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4557/15526 [1:24:22<3:23:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4558/15526 [1:24:23<3:23:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4558/15526 [1:24:23<3:23:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4559/15526 [1:24:24<3:23:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4559/15526 [1:24:24<3:23:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4560/15526 [1:24:25<3:23:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4560/15526 [1:24:25<3:23:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4561/15526 [1:24:26<3:23:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4561/15526 [1:24:26<3:23:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4562/15526 [1:24:27<3:22:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4562/15526 [1:24:27<3:22:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4563/15526 [1:24:27<3:22:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4563/15526 [1:24:27<3:22:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4564/15526 [1:24:28<3:22:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4564/15526 [1:24:28<3:22:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4565/15526 [1:24:29<3:22:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4565/15526 [1:24:29<3:22:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4566/15526 [1:24:29<3:22:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4566/15526 [1:24:29<3:22:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4567/15526 [1:24:30<3:22:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4567/15526 [1:24:30<3:22:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4568/15526 [1:24:31<3:22:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4568/15526 [1:24:31<3:22:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4569/15526 [1:24:32<3:22:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4569/15526 [1:24:32<3:22:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4570/15526 [1:24:33<3:22:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4570/15526 [1:24:33<3:22:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4571/15526 [1:24:33<3:22:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4571/15526 [1:24:33<3:22:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4572/15526 [1:24:34<3:22:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4572/15526 [1:24:34<3:22:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4573/15526 [1:24:35<3:22:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4573/15526 [1:24:35<3:22:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4574/15526 [1:24:36<3:22:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4574/15526 [1:24:36<3:22:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4575/15526 [1:24:37<3:22:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4575/15526 [1:24:37<3:22:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4576/15526 [1:24:45<3:22:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4576/15526 [1:24:45<3:22:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4577/15526 [1:24:46<3:22:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4577/15526 [1:24:46<3:22:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4578/15526 [1:24:47<3:22:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4578/15526 [1:24:47<3:22:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4579/15526 [1:24:48<3:22:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4579/15526 [1:24:48<3:22:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 4580/15526 [1:24:48<3:22:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  29%|▎| 4580/15526 [1:24:48<3:22:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4581/15526 [1:24:50<3:22:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4581/15526 [1:24:50<3:22:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4582/15526 [1:24:50<3:22:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4582/15526 [1:24:50<3:22:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4583/15526 [1:24:51<3:22:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4583/15526 [1:24:51<3:22:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4584/15526 [1:24:52<3:22:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4584/15526 [1:24:52<3:22:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4585/15526 [1:24:52<3:22:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4585/15526 [1:24:52<3:22:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4586/15526 [1:24:53<3:22:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4586/15526 [1:24:53<3:22:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4587/15526 [1:24:54<3:22:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4587/15526 [1:24:54<3:22:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4588/15526 [1:24:55<3:22:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4588/15526 [1:24:55<3:22:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4589/15526 [1:24:56<3:22:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4589/15526 [1:24:56<3:22:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4590/15526 [1:24:57<3:22:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4590/15526 [1:24:57<3:22:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4591/15526 [1:24:58<3:22:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4591/15526 [1:24:58<3:22:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4592/15526 [1:24:58<3:22:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4592/15526 [1:24:58<3:22:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4593/15526 [1:24:59<3:22:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4593/15526 [1:24:59<3:22:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4594/15526 [1:25:00<3:22:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4594/15526 [1:25:00<3:22:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4595/15526 [1:25:01<3:22:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4595/15526 [1:25:01<3:22:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4596/15526 [1:25:01<3:22:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4596/15526 [1:25:01<3:22:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4597/15526 [1:25:02<3:22:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4597/15526 [1:25:02<3:22:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4598/15526 [1:25:03<3:22:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4598/15526 [1:25:03<3:22:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4599/15526 [1:25:04<3:22:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4599/15526 [1:25:04<3:22:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4600/15526 [1:25:04<3:22:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4600/15526 [1:25:04<3:22:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4601/15526 [1:25:05<3:22:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4601/15526 [1:25:05<3:22:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4602/15526 [1:25:07<3:22:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4602/15526 [1:25:07<3:22:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4603/15526 [1:25:08<3:22:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4603/15526 [1:25:08<3:22:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4604/15526 [1:25:09<3:22:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4604/15526 [1:25:09<3:22:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4605/15526 [1:25:10<3:21:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4605/15526 [1:25:10<3:21:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4606/15526 [1:25:11<3:21:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4606/15526 [1:25:11<3:21:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4607/15526 [1:25:12<3:21:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4607/15526 [1:25:12<3:21:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4608/15526 [1:25:21<3:22:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4608/15526 [1:25:21<3:22:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4609/15526 [1:25:21<3:22:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4609/15526 [1:25:21<3:22:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4610/15526 [1:25:22<3:22:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4610/15526 [1:25:22<3:22:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4611/15526 [1:25:23<3:22:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4611/15526 [1:25:23<3:22:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4612/15526 [1:25:23<3:22:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4612/15526 [1:25:23<3:22:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4613/15526 [1:25:24<3:22:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4613/15526 [1:25:24<3:22:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4614/15526 [1:25:25<3:22:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4614/15526 [1:25:25<3:22:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4615/15526 [1:25:26<3:22:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4615/15526 [1:25:26<3:22:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4616/15526 [1:25:27<3:21:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4616/15526 [1:25:27<3:21:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4617/15526 [1:25:28<3:21:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4617/15526 [1:25:28<3:21:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4618/15526 [1:25:29<3:21:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4618/15526 [1:25:29<3:21:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4619/15526 [1:25:30<3:21:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4619/15526 [1:25:30<3:21:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4620/15526 [1:25:30<3:21:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4620/15526 [1:25:30<3:21:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4621/15526 [1:25:31<3:21:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4621/15526 [1:25:31<3:21:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4622/15526 [1:25:32<3:21:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4622/15526 [1:25:32<3:21:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4623/15526 [1:25:33<3:21:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4623/15526 [1:25:33<3:21:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4624/15526 [1:25:34<3:21:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4624/15526 [1:25:34<3:21:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4625/15526 [1:25:34<3:21:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4625/15526 [1:25:34<3:21:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4626/15526 [1:25:35<3:21:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4626/15526 [1:25:35<3:21:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4627/15526 [1:25:36<3:21:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4627/15526 [1:25:36<3:21:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4628/15526 [1:25:37<3:21:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4628/15526 [1:25:37<3:21:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4629/15526 [1:25:37<3:21:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4629/15526 [1:25:37<3:21:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4630/15526 [1:25:38<3:21:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4630/15526 [1:25:38<3:21:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4631/15526 [1:25:39<3:21:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4631/15526 [1:25:39<3:21:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4632/15526 [1:25:39<3:21:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4632/15526 [1:25:39<3:21:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4633/15526 [1:25:40<3:21:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4633/15526 [1:25:40<3:21:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4634/15526 [1:25:41<3:21:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4634/15526 [1:25:41<3:21:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4635/15526 [1:25:42<3:21:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4635/15526 [1:25:42<3:21:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4636/15526 [1:25:43<3:21:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4636/15526 [1:25:43<3:21:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4637/15526 [1:25:44<3:21:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4637/15526 [1:25:44<3:21:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4638/15526 [1:25:45<3:21:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4638/15526 [1:25:45<3:21:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4639/15526 [1:25:46<3:21:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4639/15526 [1:25:46<3:21:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4640/15526 [1:25:56<3:21:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4640/15526 [1:25:56<3:21:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4641/15526 [1:25:56<3:21:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4641/15526 [1:25:56<3:21:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4642/15526 [1:25:57<3:21:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4642/15526 [1:25:57<3:21:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4643/15526 [1:25:59<3:21:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4643/15526 [1:25:59<3:21:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4644/15526 [1:25:59<3:21:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4644/15526 [1:25:59<3:21:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4645/15526 [1:26:00<3:21:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4645/15526 [1:26:00<3:21:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4646/15526 [1:26:01<3:21:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4646/15526 [1:26:01<3:21:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4647/15526 [1:26:01<3:21:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4647/15526 [1:26:01<3:21:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4648/15526 [1:26:02<3:21:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4648/15526 [1:26:02<3:21:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4649/15526 [1:26:03<3:21:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4649/15526 [1:26:03<3:21:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4650/15526 [1:26:04<3:21:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4650/15526 [1:26:04<3:21:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4651/15526 [1:26:04<3:21:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4651/15526 [1:26:04<3:21:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4652/15526 [1:26:05<3:21:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4652/15526 [1:26:05<3:21:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4653/15526 [1:26:06<3:21:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4653/15526 [1:26:06<3:21:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4654/15526 [1:26:07<3:21:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4654/15526 [1:26:07<3:21:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4655/15526 [1:26:07<3:21:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4655/15526 [1:26:07<3:21:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4656/15526 [1:26:08<3:21:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4656/15526 [1:26:08<3:21:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4657/15526 [1:26:09<3:21:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4657/15526 [1:26:09<3:21:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4658/15526 [1:26:10<3:21:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4658/15526 [1:26:10<3:21:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4659/15526 [1:26:11<3:21:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4659/15526 [1:26:11<3:21:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4660/15526 [1:26:12<3:21:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4660/15526 [1:26:12<3:21:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4661/15526 [1:26:13<3:20:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4661/15526 [1:26:13<3:20:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4662/15526 [1:26:14<3:20:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4662/15526 [1:26:14<3:20:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4663/15526 [1:26:14<3:20:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4663/15526 [1:26:14<3:20:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4664/15526 [1:26:16<3:20:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4664/15526 [1:26:16<3:20:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4665/15526 [1:26:16<3:20:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4665/15526 [1:26:16<3:20:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4666/15526 [1:26:17<3:20:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4666/15526 [1:26:17<3:20:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4667/15526 [1:26:18<3:20:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4667/15526 [1:26:18<3:20:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4668/15526 [1:26:19<3:20:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4668/15526 [1:26:19<3:20:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4669/15526 [1:26:20<3:20:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4669/15526 [1:26:20<3:20:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4670/15526 [1:26:20<3:20:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4670/15526 [1:26:20<3:20:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4671/15526 [1:26:21<3:20:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4671/15526 [1:26:21<3:20:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4672/15526 [1:26:30<3:20:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4672/15526 [1:26:30<3:20:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4673/15526 [1:26:32<3:20:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4673/15526 [1:26:32<3:20:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4674/15526 [1:26:32<3:20:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4674/15526 [1:26:32<3:20:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4675/15526 [1:26:33<3:20:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4675/15526 [1:26:33<3:20:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4676/15526 [1:26:35<3:20:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4676/15526 [1:26:35<3:20:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4677/15526 [1:26:35<3:20:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4677/15526 [1:26:35<3:20:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4678/15526 [1:26:36<3:20:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4678/15526 [1:26:36<3:20:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4679/15526 [1:26:37<3:20:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4679/15526 [1:26:37<3:20:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4680/15526 [1:26:37<3:20:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4680/15526 [1:26:37<3:20:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4681/15526 [1:26:38<3:20:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4681/15526 [1:26:38<3:20:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4682/15526 [1:26:39<3:20:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4682/15526 [1:26:39<3:20:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4683/15526 [1:26:40<3:20:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4683/15526 [1:26:40<3:20:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4684/15526 [1:26:41<3:20:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4684/15526 [1:26:41<3:20:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4685/15526 [1:26:41<3:20:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4685/15526 [1:26:41<3:20:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4686/15526 [1:26:42<3:20:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4686/15526 [1:26:42<3:20:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4687/15526 [1:26:43<3:20:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4687/15526 [1:26:43<3:20:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4688/15526 [1:26:43<3:20:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4688/15526 [1:26:43<3:20:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4689/15526 [1:26:45<3:20:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4689/15526 [1:26:45<3:20:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4690/15526 [1:26:45<3:20:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4690/15526 [1:26:45<3:20:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4691/15526 [1:26:46<3:20:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4691/15526 [1:26:46<3:20:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4692/15526 [1:26:47<3:20:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4692/15526 [1:26:47<3:20:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4693/15526 [1:26:47<3:20:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4693/15526 [1:26:47<3:20:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4694/15526 [1:26:49<3:20:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4694/15526 [1:26:49<3:20:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4695/15526 [1:26:49<3:20:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4695/15526 [1:26:49<3:20:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4696/15526 [1:26:50<3:20:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4696/15526 [1:26:50<3:20:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4697/15526 [1:26:51<3:20:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4697/15526 [1:26:51<3:20:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4698/15526 [1:26:51<3:20:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4698/15526 [1:26:51<3:20:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4699/15526 [1:26:52<3:20:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4699/15526 [1:26:52<3:20:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4700/15526 [1:26:53<3:20:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4700/15526 [1:26:53<3:20:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4701/15526 [1:26:53<3:20:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4701/15526 [1:26:53<3:20:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4702/15526 [1:26:54<3:20:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4702/15526 [1:26:54<3:20:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4703/15526 [1:26:55<3:20:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4703/15526 [1:26:55<3:20:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4704/15526 [1:27:06<3:20:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4704/15526 [1:27:06<3:20:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4705/15526 [1:27:07<3:20:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4705/15526 [1:27:07<3:20:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4706/15526 [1:27:08<3:20:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4706/15526 [1:27:08<3:20:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4707/15526 [1:27:08<3:20:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4707/15526 [1:27:08<3:20:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4708/15526 [1:27:09<3:20:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4708/15526 [1:27:09<3:20:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4709/15526 [1:27:10<3:20:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4709/15526 [1:27:10<3:20:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4710/15526 [1:27:11<3:20:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4710/15526 [1:27:11<3:20:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4711/15526 [1:27:12<3:20:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4711/15526 [1:27:12<3:20:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4712/15526 [1:27:13<3:20:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4712/15526 [1:27:13<3:20:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4713/15526 [1:27:13<3:20:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4713/15526 [1:27:13<3:20:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4714/15526 [1:27:14<3:20:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4714/15526 [1:27:14<3:20:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4715/15526 [1:27:15<3:20:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4715/15526 [1:27:15<3:20:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4716/15526 [1:27:16<3:20:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4716/15526 [1:27:16<3:20:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4717/15526 [1:27:16<3:20:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4717/15526 [1:27:16<3:20:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4718/15526 [1:27:18<3:19:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4718/15526 [1:27:18<3:19:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4719/15526 [1:27:18<3:19:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4719/15526 [1:27:18<3:19:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4720/15526 [1:27:19<3:19:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4720/15526 [1:27:19<3:19:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4721/15526 [1:27:20<3:19:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4721/15526 [1:27:20<3:19:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4722/15526 [1:27:21<3:19:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4722/15526 [1:27:21<3:19:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4723/15526 [1:27:22<3:19:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4723/15526 [1:27:22<3:19:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4724/15526 [1:27:23<3:19:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4724/15526 [1:27:23<3:19:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4725/15526 [1:27:24<3:19:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4725/15526 [1:27:24<3:19:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4726/15526 [1:27:25<3:19:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4726/15526 [1:27:25<3:19:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4727/15526 [1:27:26<3:19:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4727/15526 [1:27:26<3:19:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4728/15526 [1:27:26<3:19:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4728/15526 [1:27:26<3:19:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4729/15526 [1:27:28<3:19:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4729/15526 [1:27:28<3:19:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4730/15526 [1:27:28<3:19:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4730/15526 [1:27:28<3:19:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4731/15526 [1:27:29<3:19:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4731/15526 [1:27:29<3:19:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4732/15526 [1:27:30<3:19:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4732/15526 [1:27:30<3:19:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4733/15526 [1:27:30<3:19:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4733/15526 [1:27:30<3:19:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4734/15526 [1:27:32<3:19:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4734/15526 [1:27:32<3:19:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 4735/15526 [1:27:32<3:19:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  30%|▎| 4735/15526 [1:27:32<3:19:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4736/15526 [1:27:41<3:19:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4736/15526 [1:27:41<3:19:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4737/15526 [1:27:41<3:19:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4737/15526 [1:27:41<3:19:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4738/15526 [1:27:42<3:19:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4738/15526 [1:27:42<3:19:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4739/15526 [1:27:43<3:19:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4739/15526 [1:27:43<3:19:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4740/15526 [1:27:44<3:19:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4740/15526 [1:27:44<3:19:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4741/15526 [1:27:44<3:19:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4741/15526 [1:27:44<3:19:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4742/15526 [1:27:45<3:19:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4742/15526 [1:27:45<3:19:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4743/15526 [1:27:47<3:19:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4743/15526 [1:27:47<3:19:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4744/15526 [1:27:48<3:19:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4744/15526 [1:27:48<3:19:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4745/15526 [1:27:49<3:19:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4745/15526 [1:27:49<3:19:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4746/15526 [1:27:50<3:19:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4746/15526 [1:27:50<3:19:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4747/15526 [1:27:51<3:19:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4747/15526 [1:27:51<3:19:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4748/15526 [1:27:51<3:19:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4748/15526 [1:27:51<3:19:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4749/15526 [1:27:52<3:19:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4749/15526 [1:27:52<3:19:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4750/15526 [1:27:53<3:19:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4750/15526 [1:27:53<3:19:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4751/15526 [1:27:53<3:19:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4751/15526 [1:27:53<3:19:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4752/15526 [1:27:55<3:19:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4752/15526 [1:27:55<3:19:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4753/15526 [1:27:55<3:19:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4753/15526 [1:27:55<3:19:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4754/15526 [1:27:56<3:19:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4754/15526 [1:27:56<3:19:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4755/15526 [1:27:57<3:19:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4755/15526 [1:27:57<3:19:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4756/15526 [1:27:57<3:19:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4756/15526 [1:27:57<3:19:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4757/15526 [1:27:58<3:19:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4757/15526 [1:27:58<3:19:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4758/15526 [1:27:59<3:19:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4758/15526 [1:27:59<3:19:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4759/15526 [1:27:59<3:19:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4759/15526 [1:27:59<3:19:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4760/15526 [1:28:00<3:19:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4760/15526 [1:28:00<3:19:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4761/15526 [1:28:01<3:19:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4761/15526 [1:28:01<3:19:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4762/15526 [1:28:02<3:19:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4762/15526 [1:28:02<3:19:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4763/15526 [1:28:03<3:18:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4763/15526 [1:28:03<3:18:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4764/15526 [1:28:03<3:18:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4764/15526 [1:28:03<3:18:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4765/15526 [1:28:04<3:18:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4765/15526 [1:28:04<3:18:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4766/15526 [1:28:05<3:18:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|���| 4766/15526 [1:28:05<3:18:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4767/15526 [1:28:06<3:18:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4767/15526 [1:28:06<3:18:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4768/15526 [1:28:15<3:19:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4768/15526 [1:28:15<3:19:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4769/15526 [1:28:16<3:19:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4769/15526 [1:28:16<3:19:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4770/15526 [1:28:18<3:19:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4770/15526 [1:28:18<3:19:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4771/15526 [1:28:19<3:19:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4771/15526 [1:28:19<3:19:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4772/15526 [1:28:20<3:19:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4772/15526 [1:28:20<3:19:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4773/15526 [1:28:21<3:19:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4773/15526 [1:28:21<3:19:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4774/15526 [1:28:21<3:19:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4774/15526 [1:28:21<3:19:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4775/15526 [1:28:22<3:18:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4775/15526 [1:28:22<3:18:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4776/15526 [1:28:23<3:18:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4776/15526 [1:28:23<3:18:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4777/15526 [1:28:23<3:18:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4777/15526 [1:28:23<3:18:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4778/15526 [1:28:24<3:18:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4778/15526 [1:28:24<3:18:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4779/15526 [1:28:25<3:18:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4779/15526 [1:28:25<3:18:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4780/15526 [1:28:26<3:18:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4780/15526 [1:28:26<3:18:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4781/15526 [1:28:26<3:18:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4781/15526 [1:28:26<3:18:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4782/15526 [1:28:28<3:18:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4782/15526 [1:28:28<3:18:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4783/15526 [1:28:28<3:18:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4783/15526 [1:28:28<3:18:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4784/15526 [1:28:29<3:18:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4784/15526 [1:28:29<3:18:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4785/15526 [1:28:30<3:18:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4785/15526 [1:28:30<3:18:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4786/15526 [1:28:31<3:18:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4786/15526 [1:28:31<3:18:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4787/15526 [1:28:32<3:18:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4787/15526 [1:28:32<3:18:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4788/15526 [1:28:33<3:18:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4788/15526 [1:28:33<3:18:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4789/15526 [1:28:33<3:18:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4789/15526 [1:28:33<3:18:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4790/15526 [1:28:34<3:18:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4790/15526 [1:28:34<3:18:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4791/15526 [1:28:35<3:18:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4791/15526 [1:28:35<3:18:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4792/15526 [1:28:35<3:18:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4792/15526 [1:28:35<3:18:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4793/15526 [1:28:37<3:18:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4793/15526 [1:28:37<3:18:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4794/15526 [1:28:38<3:18:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4794/15526 [1:28:38<3:18:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4795/15526 [1:28:38<3:18:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4795/15526 [1:28:38<3:18:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4796/15526 [1:28:39<3:18:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4796/15526 [1:28:39<3:18:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4797/15526 [1:28:40<3:18:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4797/15526 [1:28:40<3:18:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4798/15526 [1:28:40<3:18:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4798/15526 [1:28:40<3:18:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4799/15526 [1:28:42<3:18:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4799/15526 [1:28:42<3:18:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4800/15526 [1:28:49<3:18:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4800/15526 [1:28:49<3:18:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4801/15526 [1:29:13<3:19:20,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4801/15526 [1:29:13<3:19:20,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4802/15526 [1:29:14<3:19:18,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4802/15526 [1:29:14<3:19:18,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4803/15526 [1:29:15<3:19:17,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4803/15526 [1:29:15<3:19:17,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4804/15526 [1:29:16<3:19:15,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4804/15526 [1:29:16<3:19:15,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4805/15526 [1:29:17<3:19:14,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4805/15526 [1:29:17<3:19:14,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4806/15526 [1:29:18<3:19:13,  1.12s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4806/15526 [1:29:18<3:19:13,  1.12s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4807/15526 [1:29:19<3:19:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4807/15526 [1:29:19<3:19:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4808/15526 [1:29:20<3:19:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4808/15526 [1:29:20<3:19:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4809/15526 [1:29:20<3:19:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4809/15526 [1:29:20<3:19:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4810/15526 [1:29:21<3:19:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4810/15526 [1:29:21<3:19:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4811/15526 [1:29:22<3:19:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4811/15526 [1:29:22<3:19:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4812/15526 [1:29:23<3:19:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4812/15526 [1:29:23<3:19:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4813/15526 [1:29:23<3:18:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4813/15526 [1:29:23<3:18:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4814/15526 [1:29:24<3:18:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4814/15526 [1:29:24<3:18:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4815/15526 [1:29:25<3:18:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4815/15526 [1:29:25<3:18:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4816/15526 [1:29:26<3:18:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4816/15526 [1:29:26<3:18:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4817/15526 [1:29:27<3:18:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4817/15526 [1:29:27<3:18:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4818/15526 [1:29:28<3:18:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4818/15526 [1:29:28<3:18:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4819/15526 [1:29:29<3:18:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4819/15526 [1:29:29<3:18:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4820/15526 [1:29:29<3:18:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4820/15526 [1:29:29<3:18:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4821/15526 [1:29:30<3:18:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4821/15526 [1:29:30<3:18:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4822/15526 [1:29:31<3:18:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4822/15526 [1:29:31<3:18:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4823/15526 [1:29:32<3:18:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4823/15526 [1:29:32<3:18:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4824/15526 [1:29:33<3:18:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4824/15526 [1:29:33<3:18:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4825/15526 [1:29:33<3:18:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4825/15526 [1:29:33<3:18:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4826/15526 [1:29:34<3:18:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4826/15526 [1:29:34<3:18:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4827/15526 [1:29:35<3:18:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4827/15526 [1:29:35<3:18:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4828/15526 [1:29:36<3:18:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4828/15526 [1:29:36<3:18:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4829/15526 [1:29:37<3:18:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4829/15526 [1:29:37<3:18:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4830/15526 [1:29:38<3:18:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4830/15526 [1:29:38<3:18:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4831/15526 [1:29:39<3:18:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4831/15526 [1:29:39<3:18:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4832/15526 [1:29:47<3:18:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4832/15526 [1:29:47<3:18:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4833/15526 [1:29:47<3:18:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4833/15526 [1:29:47<3:18:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4834/15526 [1:29:48<3:18:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4834/15526 [1:29:48<3:18:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4835/15526 [1:29:49<3:18:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4835/15526 [1:29:49<3:18:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4836/15526 [1:29:50<3:18:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4836/15526 [1:29:50<3:18:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4837/15526 [1:29:51<3:18:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4837/15526 [1:29:51<3:18:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4838/15526 [1:29:52<3:18:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4838/15526 [1:29:52<3:18:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4839/15526 [1:29:54<3:18:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4839/15526 [1:29:54<3:18:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4840/15526 [1:29:54<3:18:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4840/15526 [1:29:54<3:18:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4841/15526 [1:29:55<3:18:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4841/15526 [1:29:55<3:18:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4842/15526 [1:29:56<3:18:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4842/15526 [1:29:56<3:18:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4843/15526 [1:29:56<3:18:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4843/15526 [1:29:56<3:18:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4844/15526 [1:29:57<3:18:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4844/15526 [1:29:57<3:18:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4845/15526 [1:29:58<3:18:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4845/15526 [1:29:58<3:18:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4846/15526 [1:29:59<3:18:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4846/15526 [1:29:59<3:18:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4847/15526 [1:30:00<3:18:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4847/15526 [1:30:00<3:18:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4848/15526 [1:30:01<3:18:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4848/15526 [1:30:01<3:18:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4849/15526 [1:30:01<3:18:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4849/15526 [1:30:01<3:18:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4850/15526 [1:30:03<3:18:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4850/15526 [1:30:03<3:18:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4851/15526 [1:30:03<3:18:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4851/15526 [1:30:03<3:18:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4852/15526 [1:30:04<3:18:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4852/15526 [1:30:04<3:18:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4853/15526 [1:30:05<3:18:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4853/15526 [1:30:05<3:18:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4854/15526 [1:30:06<3:18:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4854/15526 [1:30:06<3:18:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4855/15526 [1:30:07<3:18:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4855/15526 [1:30:07<3:18:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4856/15526 [1:30:07<3:18:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4856/15526 [1:30:07<3:18:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4857/15526 [1:30:08<3:18:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4857/15526 [1:30:08<3:18:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4858/15526 [1:30:09<3:17:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4858/15526 [1:30:09<3:17:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4859/15526 [1:30:10<3:17:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4859/15526 [1:30:10<3:17:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4860/15526 [1:30:11<3:17:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4860/15526 [1:30:11<3:17:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4861/15526 [1:30:12<3:17:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4861/15526 [1:30:12<3:17:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4862/15526 [1:30:12<3:17:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4862/15526 [1:30:12<3:17:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4863/15526 [1:30:13<3:17:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4863/15526 [1:30:13<3:17:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4864/15526 [1:30:21<3:18:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4864/15526 [1:30:21<3:18:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4865/15526 [1:30:22<3:18:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4865/15526 [1:30:22<3:18:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4866/15526 [1:30:23<3:18:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4866/15526 [1:30:23<3:18:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4867/15526 [1:30:24<3:17:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4867/15526 [1:30:24<3:17:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4868/15526 [1:30:24<3:17:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4868/15526 [1:30:24<3:17:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4869/15526 [1:30:25<3:17:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4869/15526 [1:30:25<3:17:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4870/15526 [1:30:26<3:17:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4870/15526 [1:30:26<3:17:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4871/15526 [1:30:27<3:17:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4871/15526 [1:30:27<3:17:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4872/15526 [1:30:28<3:17:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4872/15526 [1:30:28<3:17:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4873/15526 [1:30:29<3:17:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4873/15526 [1:30:29<3:17:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4874/15526 [1:30:29<3:17:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4874/15526 [1:30:29<3:17:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4875/15526 [1:30:30<3:17:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4875/15526 [1:30:30<3:17:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4876/15526 [1:30:31<3:17:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4876/15526 [1:30:31<3:17:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4877/15526 [1:30:31<3:17:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4877/15526 [1:30:31<3:17:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4878/15526 [1:30:33<3:17:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4878/15526 [1:30:33<3:17:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4879/15526 [1:30:33<3:17:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4879/15526 [1:30:33<3:17:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4880/15526 [1:30:34<3:17:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4880/15526 [1:30:34<3:17:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4881/15526 [1:30:35<3:17:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4881/15526 [1:30:35<3:17:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4882/15526 [1:30:36<3:17:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4882/15526 [1:30:36<3:17:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4883/15526 [1:30:37<3:17:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4883/15526 [1:30:37<3:17:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4884/15526 [1:30:38<3:17:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4884/15526 [1:30:38<3:17:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4885/15526 [1:30:39<3:17:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4885/15526 [1:30:39<3:17:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4886/15526 [1:30:40<3:17:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4886/15526 [1:30:40<3:17:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4887/15526 [1:30:41<3:17:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4887/15526 [1:30:41<3:17:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4888/15526 [1:30:42<3:17:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4888/15526 [1:30:42<3:17:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4889/15526 [1:30:42<3:17:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4889/15526 [1:30:42<3:17:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 4890/15526 [1:30:43<3:17:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  31%|▎| 4890/15526 [1:30:43<3:17:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4891/15526 [1:30:44<3:17:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4891/15526 [1:30:44<3:17:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4892/15526 [1:30:45<3:17:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4892/15526 [1:30:45<3:17:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4893/15526 [1:30:46<3:17:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4893/15526 [1:30:46<3:17:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4894/15526 [1:30:46<3:17:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4894/15526 [1:30:46<3:17:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4895/15526 [1:30:47<3:17:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4895/15526 [1:30:47<3:17:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4896/15526 [1:30:56<3:17:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4896/15526 [1:30:56<3:17:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4897/15526 [1:30:56<3:17:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4897/15526 [1:30:56<3:17:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4898/15526 [1:30:57<3:17:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4898/15526 [1:30:57<3:17:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4899/15526 [1:30:58<3:17:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4899/15526 [1:30:58<3:17:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4900/15526 [1:30:59<3:17:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4900/15526 [1:30:59<3:17:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4901/15526 [1:31:00<3:17:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4901/15526 [1:31:00<3:17:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4902/15526 [1:31:00<3:17:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4902/15526 [1:31:00<3:17:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4903/15526 [1:31:01<3:17:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4903/15526 [1:31:01<3:17:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4904/15526 [1:31:02<3:17:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4904/15526 [1:31:02<3:17:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4905/15526 [1:31:03<3:17:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4905/15526 [1:31:03<3:17:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4906/15526 [1:31:04<3:17:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4906/15526 [1:31:04<3:17:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4907/15526 [1:31:04<3:17:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4907/15526 [1:31:04<3:17:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4908/15526 [1:31:05<3:17:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4908/15526 [1:31:05<3:17:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4909/15526 [1:31:06<3:17:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4909/15526 [1:31:06<3:17:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4910/15526 [1:31:07<3:17:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4910/15526 [1:31:07<3:17:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4911/15526 [1:31:08<3:16:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4911/15526 [1:31:08<3:16:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4912/15526 [1:31:09<3:16:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4912/15526 [1:31:09<3:16:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4913/15526 [1:31:09<3:16:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4913/15526 [1:31:09<3:16:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4914/15526 [1:31:10<3:16:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4914/15526 [1:31:10<3:16:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4915/15526 [1:31:11<3:16:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4915/15526 [1:31:11<3:16:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4916/15526 [1:31:12<3:16:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4916/15526 [1:31:12<3:16:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4917/15526 [1:31:14<3:16:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4917/15526 [1:31:14<3:16:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4918/15526 [1:31:15<3:16:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4918/15526 [1:31:15<3:16:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4919/15526 [1:31:16<3:16:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4919/15526 [1:31:16<3:16:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4920/15526 [1:31:17<3:16:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4920/15526 [1:31:17<3:16:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4921/15526 [1:31:17<3:16:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4921/15526 [1:31:17<3:16:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4922/15526 [1:31:18<3:16:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4922/15526 [1:31:18<3:16:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4923/15526 [1:31:19<3:16:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4923/15526 [1:31:19<3:16:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4924/15526 [1:31:19<3:16:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4924/15526 [1:31:19<3:16:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4925/15526 [1:31:21<3:16:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4925/15526 [1:31:21<3:16:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4926/15526 [1:31:21<3:16:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4926/15526 [1:31:21<3:16:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4927/15526 [1:31:22<3:16:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4927/15526 [1:31:22<3:16:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4928/15526 [1:31:29<3:16:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4928/15526 [1:31:29<3:16:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4929/15526 [1:31:30<3:16:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4929/15526 [1:31:30<3:16:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4930/15526 [1:31:31<3:16:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4930/15526 [1:31:31<3:16:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4931/15526 [1:31:32<3:16:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4931/15526 [1:31:32<3:16:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4932/15526 [1:31:33<3:16:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4932/15526 [1:31:33<3:16:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4933/15526 [1:31:33<3:16:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4933/15526 [1:31:33<3:16:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4934/15526 [1:31:34<3:16:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4934/15526 [1:31:34<3:16:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4935/15526 [1:31:35<3:16:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4935/15526 [1:31:35<3:16:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4936/15526 [1:31:35<3:16:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4936/15526 [1:31:35<3:16:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4937/15526 [1:31:37<3:16:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4937/15526 [1:31:37<3:16:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4938/15526 [1:31:38<3:16:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4938/15526 [1:31:38<3:16:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4939/15526 [1:31:39<3:16:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4939/15526 [1:31:39<3:16:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4940/15526 [1:31:39<3:16:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4940/15526 [1:31:39<3:16:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4941/15526 [1:31:40<3:16:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4941/15526 [1:31:40<3:16:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4942/15526 [1:31:41<3:16:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4942/15526 [1:31:41<3:16:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4943/15526 [1:31:41<3:16:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4943/15526 [1:31:41<3:16:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4944/15526 [1:31:42<3:16:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4944/15526 [1:31:42<3:16:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4945/15526 [1:31:43<3:16:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4945/15526 [1:31:43<3:16:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4946/15526 [1:31:44<3:16:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4946/15526 [1:31:44<3:16:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4947/15526 [1:31:45<3:16:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4947/15526 [1:31:45<3:16:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4948/15526 [1:31:46<3:16:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4948/15526 [1:31:46<3:16:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4949/15526 [1:31:46<3:16:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4949/15526 [1:31:46<3:16:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4950/15526 [1:31:48<3:16:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4950/15526 [1:31:48<3:16:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4951/15526 [1:31:48<3:16:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4951/15526 [1:31:48<3:16:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4952/15526 [1:31:50<3:16:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4952/15526 [1:31:50<3:16:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4953/15526 [1:31:50<3:16:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4953/15526 [1:31:50<3:16:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4954/15526 [1:31:51<3:16:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4954/15526 [1:31:51<3:16:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4955/15526 [1:31:52<3:15:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4955/15526 [1:31:52<3:15:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4956/15526 [1:31:52<3:15:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4956/15526 [1:31:52<3:15:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4957/15526 [1:31:54<3:15:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4957/15526 [1:31:54<3:15:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4958/15526 [1:31:54<3:15:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4958/15526 [1:31:54<3:15:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4959/15526 [1:31:55<3:15:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4959/15526 [1:31:55<3:15:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4960/15526 [1:32:03<3:16:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4960/15526 [1:32:03<3:16:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4961/15526 [1:32:04<3:16:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4961/15526 [1:32:04<3:16:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4962/15526 [1:32:05<3:16:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4962/15526 [1:32:05<3:16:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4963/15526 [1:32:05<3:16:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4963/15526 [1:32:05<3:16:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4964/15526 [1:32:07<3:16:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4964/15526 [1:32:07<3:16:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4965/15526 [1:32:07<3:15:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4965/15526 [1:32:07<3:15:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4966/15526 [1:32:08<3:15:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4966/15526 [1:32:08<3:15:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4967/15526 [1:32:09<3:15:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4967/15526 [1:32:09<3:15:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4968/15526 [1:32:10<3:15:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4968/15526 [1:32:10<3:15:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4969/15526 [1:32:11<3:15:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4969/15526 [1:32:11<3:15:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4970/15526 [1:32:12<3:15:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4970/15526 [1:32:12<3:15:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4971/15526 [1:32:12<3:15:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4971/15526 [1:32:12<3:15:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4972/15526 [1:32:13<3:15:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4972/15526 [1:32:13<3:15:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4973/15526 [1:32:14<3:15:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4973/15526 [1:32:14<3:15:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4974/15526 [1:32:15<3:15:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4974/15526 [1:32:15<3:15:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4975/15526 [1:32:16<3:15:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4975/15526 [1:32:16<3:15:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4976/15526 [1:32:16<3:15:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4976/15526 [1:32:16<3:15:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4977/15526 [1:32:18<3:15:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4977/15526 [1:32:18<3:15:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4978/15526 [1:32:18<3:15:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4978/15526 [1:32:18<3:15:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4979/15526 [1:32:20<3:15:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4979/15526 [1:32:20<3:15:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4980/15526 [1:32:21<3:15:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4980/15526 [1:32:21<3:15:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4981/15526 [1:32:22<3:15:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4981/15526 [1:32:22<3:15:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4982/15526 [1:32:22<3:15:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4982/15526 [1:32:22<3:15:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4983/15526 [1:32:23<3:15:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4983/15526 [1:32:23<3:15:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4984/15526 [1:32:24<3:15:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4984/15526 [1:32:24<3:15:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4985/15526 [1:32:25<3:15:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4985/15526 [1:32:25<3:15:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4986/15526 [1:32:25<3:15:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4986/15526 [1:32:25<3:15:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4987/15526 [1:32:27<3:15:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4987/15526 [1:32:27<3:15:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4988/15526 [1:32:28<3:15:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4988/15526 [1:32:28<3:15:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4989/15526 [1:32:29<3:15:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4989/15526 [1:32:29<3:15:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4990/15526 [1:32:29<3:15:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4990/15526 [1:32:29<3:15:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4991/15526 [1:32:30<3:15:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4991/15526 [1:32:30<3:15:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4992/15526 [1:32:39<3:15:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4992/15526 [1:32:39<3:15:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4993/15526 [1:32:40<3:15:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4993/15526 [1:32:40<3:15:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4994/15526 [1:32:41<3:15:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4994/15526 [1:32:41<3:15:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4995/15526 [1:32:42<3:15:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4995/15526 [1:32:42<3:15:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4996/15526 [1:32:43<3:15:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4996/15526 [1:32:43<3:15:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4997/15526 [1:32:44<3:15:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4997/15526 [1:32:44<3:15:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4998/15526 [1:32:45<3:15:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4998/15526 [1:32:45<3:15:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 4999/15526 [1:32:46<3:15:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 4999/15526 [1:32:46<3:15:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5000/15526 [1:32:46<3:15:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5000/15526 [1:32:46<3:15:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5001/15526 [1:32:47<3:15:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5001/15526 [1:32:47<3:15:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5002/15526 [1:32:48<3:15:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5002/15526 [1:32:48<3:15:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5003/15526 [1:32:49<3:15:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5003/15526 [1:32:49<3:15:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5004/15526 [1:32:50<3:15:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5004/15526 [1:32:50<3:15:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5005/15526 [1:32:51<3:15:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5005/15526 [1:32:51<3:15:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5006/15526 [1:32:52<3:15:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5006/15526 [1:32:52<3:15:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5007/15526 [1:32:52<3:15:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5007/15526 [1:32:52<3:15:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5008/15526 [1:32:54<3:15:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5008/15526 [1:32:54<3:15:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5009/15526 [1:32:54<3:15:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5009/15526 [1:32:54<3:15:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5010/15526 [1:32:56<3:15:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5010/15526 [1:32:56<3:15:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5011/15526 [1:32:56<3:15:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5011/15526 [1:32:56<3:15:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5012/15526 [1:32:57<3:15:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5012/15526 [1:32:57<3:15:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5013/15526 [1:32:59<3:15:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5013/15526 [1:32:59<3:15:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5014/15526 [1:32:59<3:14:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5014/15526 [1:32:59<3:14:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5015/15526 [1:33:01<3:14:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5015/15526 [1:33:01<3:14:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5016/15526 [1:33:01<3:14:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5016/15526 [1:33:01<3:14:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5017/15526 [1:33:02<3:14:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5017/15526 [1:33:02<3:14:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5018/15526 [1:33:03<3:14:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5018/15526 [1:33:03<3:14:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5019/15526 [1:33:04<3:14:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5019/15526 [1:33:04<3:14:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5020/15526 [1:33:05<3:14:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5020/15526 [1:33:05<3:14:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5021/15526 [1:33:06<3:14:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5021/15526 [1:33:06<3:14:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5022/15526 [1:33:06<3:14:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5022/15526 [1:33:06<3:14:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5023/15526 [1:33:07<3:14:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5023/15526 [1:33:07<3:14:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5024/15526 [1:33:13<3:14:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5024/15526 [1:33:13<3:14:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5025/15526 [1:33:14<3:14:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5025/15526 [1:33:14<3:14:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5026/15526 [1:33:14<3:14:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5026/15526 [1:33:14<3:14:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5027/15526 [1:33:15<3:14:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5027/15526 [1:33:15<3:14:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5028/15526 [1:33:16<3:14:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5028/15526 [1:33:16<3:14:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5029/15526 [1:33:17<3:14:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5029/15526 [1:33:17<3:14:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5030/15526 [1:33:18<3:14:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5030/15526 [1:33:18<3:14:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5031/15526 [1:33:18<3:14:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5031/15526 [1:33:18<3:14:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5032/15526 [1:33:19<3:14:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5032/15526 [1:33:19<3:14:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5033/15526 [1:33:20<3:14:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5033/15526 [1:33:20<3:14:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5034/15526 [1:33:20<3:14:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5034/15526 [1:33:20<3:14:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5035/15526 [1:33:21<3:14:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5035/15526 [1:33:21<3:14:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5036/15526 [1:33:22<3:14:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5036/15526 [1:33:22<3:14:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5037/15526 [1:33:23<3:14:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5037/15526 [1:33:23<3:14:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5038/15526 [1:33:24<3:14:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5038/15526 [1:33:24<3:14:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5039/15526 [1:33:25<3:14:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5039/15526 [1:33:25<3:14:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5040/15526 [1:33:26<3:14:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5040/15526 [1:33:26<3:14:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5041/15526 [1:33:26<3:14:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5041/15526 [1:33:26<3:14:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5042/15526 [1:33:27<3:14:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5042/15526 [1:33:27<3:14:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5043/15526 [1:33:28<3:14:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5043/15526 [1:33:28<3:14:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5044/15526 [1:33:29<3:14:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5044/15526 [1:33:29<3:14:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 5045/15526 [1:33:30<3:14:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  32%|▎| 5045/15526 [1:33:30<3:14:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5046/15526 [1:33:31<3:14:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5046/15526 [1:33:31<3:14:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5047/15526 [1:33:32<3:14:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5047/15526 [1:33:32<3:14:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5048/15526 [1:33:33<3:14:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5048/15526 [1:33:33<3:14:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5049/15526 [1:33:34<3:14:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5049/15526 [1:33:34<3:14:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5050/15526 [1:33:35<3:14:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5050/15526 [1:33:35<3:14:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5051/15526 [1:33:36<3:14:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5051/15526 [1:33:36<3:14:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5052/15526 [1:33:37<3:14:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5052/15526 [1:33:37<3:14:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5053/15526 [1:33:37<3:14:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5053/15526 [1:33:37<3:14:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5054/15526 [1:33:38<3:14:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5054/15526 [1:33:38<3:14:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5055/15526 [1:33:39<3:13:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5055/15526 [1:33:39<3:13:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5056/15526 [1:33:47<3:14:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5056/15526 [1:33:47<3:14:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5057/15526 [1:33:47<3:14:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5057/15526 [1:33:47<3:14:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5058/15526 [1:33:49<3:14:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5058/15526 [1:33:49<3:14:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5059/15526 [1:33:49<3:14:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5059/15526 [1:33:49<3:14:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5060/15526 [1:33:50<3:14:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5060/15526 [1:33:50<3:14:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5061/15526 [1:33:51<3:14:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5061/15526 [1:33:51<3:14:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5062/15526 [1:33:52<3:14:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5062/15526 [1:33:52<3:14:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5063/15526 [1:33:52<3:14:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5063/15526 [1:33:52<3:14:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5064/15526 [1:33:53<3:13:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5064/15526 [1:33:53<3:13:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5065/15526 [1:33:54<3:13:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5065/15526 [1:33:54<3:13:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5066/15526 [1:33:55<3:13:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5066/15526 [1:33:55<3:13:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5067/15526 [1:33:56<3:13:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5067/15526 [1:33:56<3:13:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5068/15526 [1:33:56<3:13:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5068/15526 [1:33:56<3:13:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5069/15526 [1:33:57<3:13:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5069/15526 [1:33:57<3:13:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5070/15526 [1:33:58<3:13:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5070/15526 [1:33:58<3:13:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5071/15526 [1:33:59<3:13:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5071/15526 [1:33:59<3:13:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5072/15526 [1:34:00<3:13:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5072/15526 [1:34:00<3:13:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5073/15526 [1:34:00<3:13:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5073/15526 [1:34:00<3:13:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5074/15526 [1:34:01<3:13:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5074/15526 [1:34:01<3:13:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5075/15526 [1:34:02<3:13:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5075/15526 [1:34:02<3:13:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5076/15526 [1:34:03<3:13:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5076/15526 [1:34:03<3:13:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5077/15526 [1:34:04<3:13:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5077/15526 [1:34:04<3:13:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5078/15526 [1:34:05<3:13:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5078/15526 [1:34:05<3:13:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5079/15526 [1:34:05<3:13:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5079/15526 [1:34:05<3:13:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5080/15526 [1:34:07<3:13:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5080/15526 [1:34:07<3:13:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5081/15526 [1:34:07<3:13:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5081/15526 [1:34:07<3:13:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5082/15526 [1:34:08<3:13:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5082/15526 [1:34:08<3:13:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5083/15526 [1:34:09<3:13:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5083/15526 [1:34:09<3:13:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5084/15526 [1:34:09<3:13:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5084/15526 [1:34:09<3:13:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5085/15526 [1:34:10<3:13:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5085/15526 [1:34:10<3:13:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5086/15526 [1:34:11<3:13:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5086/15526 [1:34:11<3:13:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5087/15526 [1:34:12<3:13:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5087/15526 [1:34:12<3:13:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5088/15526 [1:34:22<3:13:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5088/15526 [1:34:22<3:13:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5089/15526 [1:34:22<3:13:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5089/15526 [1:34:22<3:13:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5090/15526 [1:34:23<3:13:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5090/15526 [1:34:23<3:13:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5091/15526 [1:34:24<3:13:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5091/15526 [1:34:24<3:13:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5092/15526 [1:34:25<3:13:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5092/15526 [1:34:25<3:13:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5093/15526 [1:34:26<3:13:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5093/15526 [1:34:26<3:13:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5094/15526 [1:34:26<3:13:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5094/15526 [1:34:26<3:13:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5095/15526 [1:34:27<3:13:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5095/15526 [1:34:27<3:13:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5096/15526 [1:34:28<3:13:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5096/15526 [1:34:28<3:13:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5097/15526 [1:34:28<3:13:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5097/15526 [1:34:28<3:13:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5098/15526 [1:34:29<3:13:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5098/15526 [1:34:29<3:13:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5099/15526 [1:34:30<3:13:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5099/15526 [1:34:30<3:13:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5100/15526 [1:34:30<3:13:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5100/15526 [1:34:30<3:13:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5101/15526 [1:34:31<3:13:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5101/15526 [1:34:31<3:13:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5102/15526 [1:34:32<3:13:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5102/15526 [1:34:32<3:13:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5103/15526 [1:34:33<3:13:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5103/15526 [1:34:33<3:13:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5104/15526 [1:34:33<3:13:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5104/15526 [1:34:33<3:13:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5105/15526 [1:34:34<3:13:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5105/15526 [1:34:34<3:13:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5106/15526 [1:34:35<3:13:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5106/15526 [1:34:35<3:13:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5107/15526 [1:34:36<3:13:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5107/15526 [1:34:36<3:13:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5108/15526 [1:34:37<3:12:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5108/15526 [1:34:37<3:12:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5109/15526 [1:34:37<3:12:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5109/15526 [1:34:37<3:12:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5110/15526 [1:34:38<3:12:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5110/15526 [1:34:38<3:12:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5111/15526 [1:34:39<3:12:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5111/15526 [1:34:39<3:12:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5112/15526 [1:34:40<3:12:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5112/15526 [1:34:40<3:12:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5113/15526 [1:34:41<3:12:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5113/15526 [1:34:41<3:12:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5114/15526 [1:34:42<3:12:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5114/15526 [1:34:42<3:12:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5115/15526 [1:34:43<3:12:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5115/15526 [1:34:43<3:12:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5116/15526 [1:34:43<3:12:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5116/15526 [1:34:43<3:12:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5117/15526 [1:34:45<3:12:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5117/15526 [1:34:45<3:12:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5118/15526 [1:34:46<3:12:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5118/15526 [1:34:46<3:12:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5119/15526 [1:34:47<3:12:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5119/15526 [1:34:47<3:12:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5120/15526 [1:34:55<3:12:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5120/15526 [1:34:55<3:12:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5121/15526 [1:34:56<3:12:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5121/15526 [1:34:56<3:12:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5122/15526 [1:34:56<3:12:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5122/15526 [1:34:56<3:12:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5123/15526 [1:34:58<3:12:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5123/15526 [1:34:58<3:12:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5124/15526 [1:34:59<3:12:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5124/15526 [1:34:59<3:12:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5125/15526 [1:35:00<3:12:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5125/15526 [1:35:00<3:12:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5126/15526 [1:35:01<3:12:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5126/15526 [1:35:01<3:12:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5127/15526 [1:35:02<3:12:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5127/15526 [1:35:02<3:12:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5128/15526 [1:35:03<3:12:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5128/15526 [1:35:03<3:12:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5129/15526 [1:35:03<3:12:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5129/15526 [1:35:03<3:12:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5130/15526 [1:35:04<3:12:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5130/15526 [1:35:04<3:12:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5131/15526 [1:35:05<3:12:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5131/15526 [1:35:05<3:12:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5132/15526 [1:35:06<3:12:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5132/15526 [1:35:06<3:12:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5133/15526 [1:35:07<3:12:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5133/15526 [1:35:07<3:12:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5134/15526 [1:35:08<3:12:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5134/15526 [1:35:08<3:12:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5135/15526 [1:35:08<3:12:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5135/15526 [1:35:08<3:12:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5136/15526 [1:35:09<3:12:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5136/15526 [1:35:09<3:12:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5137/15526 [1:35:10<3:12:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5137/15526 [1:35:10<3:12:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5138/15526 [1:35:11<3:12:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5138/15526 [1:35:11<3:12:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5139/15526 [1:35:12<3:12:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5139/15526 [1:35:12<3:12:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5140/15526 [1:35:13<3:12:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5140/15526 [1:35:13<3:12:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5141/15526 [1:35:14<3:12:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5141/15526 [1:35:14<3:12:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5142/15526 [1:35:15<3:12:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5142/15526 [1:35:15<3:12:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5143/15526 [1:35:16<3:12:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5143/15526 [1:35:16<3:12:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5144/15526 [1:35:17<3:12:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5144/15526 [1:35:17<3:12:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5145/15526 [1:35:18<3:12:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5145/15526 [1:35:18<3:12:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5146/15526 [1:35:19<3:12:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5146/15526 [1:35:19<3:12:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5147/15526 [1:35:19<3:12:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5147/15526 [1:35:19<3:12:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5148/15526 [1:35:20<3:12:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5148/15526 [1:35:20<3:12:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5149/15526 [1:35:21<3:12:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5149/15526 [1:35:21<3:12:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5150/15526 [1:35:22<3:12:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5150/15526 [1:35:22<3:12:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5151/15526 [1:35:22<3:12:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5151/15526 [1:35:22<3:12:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5152/15526 [1:35:30<3:12:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5152/15526 [1:35:30<3:12:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5153/15526 [1:35:31<3:12:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5153/15526 [1:35:31<3:12:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5154/15526 [1:35:33<3:12:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5154/15526 [1:35:33<3:12:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5155/15526 [1:35:33<3:12:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5155/15526 [1:35:33<3:12:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5156/15526 [1:35:34<3:12:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5156/15526 [1:35:34<3:12:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5157/15526 [1:35:35<3:12:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5157/15526 [1:35:35<3:12:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5158/15526 [1:35:36<3:12:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5158/15526 [1:35:36<3:12:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5159/15526 [1:35:36<3:12:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5159/15526 [1:35:36<3:12:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5160/15526 [1:35:38<3:12:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5160/15526 [1:35:38<3:12:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5161/15526 [1:35:38<3:12:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5161/15526 [1:35:38<3:12:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5162/15526 [1:35:39<3:12:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5162/15526 [1:35:39<3:12:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5163/15526 [1:35:39<3:12:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5163/15526 [1:35:39<3:12:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5164/15526 [1:35:40<3:11:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5164/15526 [1:35:40<3:11:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5165/15526 [1:35:41<3:11:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5165/15526 [1:35:41<3:11:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5166/15526 [1:35:41<3:11:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5166/15526 [1:35:41<3:11:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5167/15526 [1:35:43<3:11:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5167/15526 [1:35:43<3:11:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5168/15526 [1:35:43<3:11:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5168/15526 [1:35:43<3:11:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5169/15526 [1:35:45<3:11:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5169/15526 [1:35:45<3:11:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5170/15526 [1:35:46<3:11:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5170/15526 [1:35:46<3:11:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5171/15526 [1:35:46<3:11:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5171/15526 [1:35:46<3:11:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5172/15526 [1:35:47<3:11:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5172/15526 [1:35:47<3:11:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5173/15526 [1:35:48<3:11:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5173/15526 [1:35:48<3:11:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5174/15526 [1:35:48<3:11:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5174/15526 [1:35:48<3:11:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5175/15526 [1:35:49<3:11:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5175/15526 [1:35:49<3:11:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5176/15526 [1:35:51<3:11:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5176/15526 [1:35:51<3:11:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5177/15526 [1:35:51<3:11:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5177/15526 [1:35:51<3:11:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5178/15526 [1:35:52<3:11:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5178/15526 [1:35:52<3:11:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5179/15526 [1:35:53<3:11:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5179/15526 [1:35:53<3:11:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5180/15526 [1:35:54<3:11:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5180/15526 [1:35:54<3:11:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5181/15526 [1:35:54<3:11:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5181/15526 [1:35:54<3:11:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5182/15526 [1:35:56<3:11:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5182/15526 [1:35:56<3:11:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5183/15526 [1:35:56<3:11:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5183/15526 [1:35:56<3:11:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5184/15526 [1:36:03<3:11:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5184/15526 [1:36:03<3:11:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5185/15526 [1:36:04<3:11:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5185/15526 [1:36:04<3:11:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5186/15526 [1:36:05<3:11:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5186/15526 [1:36:05<3:11:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5187/15526 [1:36:06<3:11:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5187/15526 [1:36:06<3:11:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5188/15526 [1:36:06<3:11:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5188/15526 [1:36:06<3:11:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5189/15526 [1:36:08<3:11:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5189/15526 [1:36:08<3:11:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5190/15526 [1:36:08<3:11:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5190/15526 [1:36:08<3:11:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5191/15526 [1:36:09<3:11:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5191/15526 [1:36:09<3:11:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5192/15526 [1:36:10<3:11:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5192/15526 [1:36:10<3:11:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5193/15526 [1:36:10<3:11:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5193/15526 [1:36:10<3:11:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5194/15526 [1:36:11<3:11:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5194/15526 [1:36:11<3:11:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5195/15526 [1:36:12<3:11:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5195/15526 [1:36:12<3:11:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5196/15526 [1:36:13<3:11:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5196/15526 [1:36:13<3:11:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5197/15526 [1:36:14<3:11:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5197/15526 [1:36:14<3:11:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5198/15526 [1:36:16<3:11:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5198/15526 [1:36:16<3:11:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5199/15526 [1:36:16<3:11:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5199/15526 [1:36:16<3:11:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5200/15526 [1:36:17<3:11:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5200/15526 [1:36:17<3:11:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 5201/15526 [1:36:18<3:11:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  33%|▎| 5201/15526 [1:36:18<3:11:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5202/15526 [1:36:19<3:11:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5202/15526 [1:36:19<3:11:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5203/15526 [1:36:19<3:11:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5203/15526 [1:36:19<3:11:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5204/15526 [1:36:20<3:11:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5204/15526 [1:36:20<3:11:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5205/15526 [1:36:21<3:11:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5205/15526 [1:36:21<3:11:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5206/15526 [1:36:21<3:11:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5206/15526 [1:36:21<3:11:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5207/15526 [1:36:23<3:11:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5207/15526 [1:36:23<3:11:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5208/15526 [1:36:23<3:10:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5208/15526 [1:36:23<3:10:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5209/15526 [1:36:24<3:10:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5209/15526 [1:36:24<3:10:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5210/15526 [1:36:26<3:10:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5210/15526 [1:36:26<3:10:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5211/15526 [1:36:27<3:10:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5211/15526 [1:36:27<3:10:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5212/15526 [1:36:27<3:10:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5212/15526 [1:36:27<3:10:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5213/15526 [1:36:28<3:10:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5213/15526 [1:36:28<3:10:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5214/15526 [1:36:29<3:10:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5214/15526 [1:36:29<3:10:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5215/15526 [1:36:30<3:10:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5215/15526 [1:36:30<3:10:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5216/15526 [1:36:39<3:11:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5216/15526 [1:36:39<3:11:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5217/15526 [1:36:40<3:11:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5217/15526 [1:36:40<3:11:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5218/15526 [1:36:41<3:11:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5218/15526 [1:36:41<3:11:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5219/15526 [1:36:42<3:10:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5219/15526 [1:36:42<3:10:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5220/15526 [1:36:43<3:10:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5220/15526 [1:36:43<3:10:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5221/15526 [1:36:43<3:10:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5221/15526 [1:36:43<3:10:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5222/15526 [1:36:44<3:10:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5222/15526 [1:36:44<3:10:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5223/15526 [1:36:45<3:10:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5223/15526 [1:36:45<3:10:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5224/15526 [1:36:46<3:10:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5224/15526 [1:36:46<3:10:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5225/15526 [1:36:47<3:10:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5225/15526 [1:36:47<3:10:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5226/15526 [1:36:48<3:10:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5226/15526 [1:36:48<3:10:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5227/15526 [1:36:49<3:10:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5227/15526 [1:36:49<3:10:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5228/15526 [1:36:50<3:10:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5228/15526 [1:36:50<3:10:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5229/15526 [1:36:51<3:10:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5229/15526 [1:36:51<3:10:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5230/15526 [1:36:52<3:10:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5230/15526 [1:36:52<3:10:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5231/15526 [1:36:53<3:10:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5231/15526 [1:36:53<3:10:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5232/15526 [1:36:54<3:10:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5232/15526 [1:36:54<3:10:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5233/15526 [1:36:55<3:10:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5233/15526 [1:36:55<3:10:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5234/15526 [1:36:56<3:10:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5234/15526 [1:36:56<3:10:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5235/15526 [1:36:57<3:10:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5235/15526 [1:36:57<3:10:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5236/15526 [1:36:58<3:10:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5236/15526 [1:36:58<3:10:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5237/15526 [1:36:59<3:10:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5237/15526 [1:36:59<3:10:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5238/15526 [1:37:00<3:10:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5238/15526 [1:37:00<3:10:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5239/15526 [1:37:01<3:10:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5239/15526 [1:37:01<3:10:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5240/15526 [1:37:02<3:10:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5240/15526 [1:37:02<3:10:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5241/15526 [1:37:03<3:10:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5241/15526 [1:37:03<3:10:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5242/15526 [1:37:03<3:10:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5242/15526 [1:37:03<3:10:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5243/15526 [1:37:04<3:10:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5243/15526 [1:37:04<3:10:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5244/15526 [1:37:05<3:10:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5244/15526 [1:37:05<3:10:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5245/15526 [1:37:05<3:10:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5245/15526 [1:37:05<3:10:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5246/15526 [1:37:06<3:10:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5246/15526 [1:37:06<3:10:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5247/15526 [1:37:07<3:10:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5247/15526 [1:37:07<3:10:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5248/15526 [1:37:14<3:10:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5248/15526 [1:37:14<3:10:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5249/15526 [1:37:15<3:10:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5249/15526 [1:37:15<3:10:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5250/15526 [1:37:16<3:10:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5250/15526 [1:37:16<3:10:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5251/15526 [1:37:16<3:10:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5251/15526 [1:37:16<3:10:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5252/15526 [1:37:17<3:10:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5252/15526 [1:37:17<3:10:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5253/15526 [1:37:18<3:10:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5253/15526 [1:37:18<3:10:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5254/15526 [1:37:18<3:10:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5254/15526 [1:37:18<3:10:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5255/15526 [1:37:20<3:10:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5255/15526 [1:37:20<3:10:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5256/15526 [1:37:20<3:10:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5256/15526 [1:37:20<3:10:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5257/15526 [1:37:21<3:10:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5257/15526 [1:37:21<3:10:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5258/15526 [1:37:22<3:10:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5258/15526 [1:37:22<3:10:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5259/15526 [1:37:23<3:10:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5259/15526 [1:37:23<3:10:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5260/15526 [1:37:24<3:10:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5260/15526 [1:37:24<3:10:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5261/15526 [1:37:24<3:10:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5261/15526 [1:37:24<3:10:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5262/15526 [1:37:25<3:10:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5262/15526 [1:37:25<3:10:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5263/15526 [1:37:26<3:10:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5263/15526 [1:37:26<3:10:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5264/15526 [1:37:27<3:10:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5264/15526 [1:37:27<3:10:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5265/15526 [1:37:28<3:09:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5265/15526 [1:37:28<3:09:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5266/15526 [1:37:29<3:09:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5266/15526 [1:37:29<3:09:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5267/15526 [1:37:29<3:09:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5267/15526 [1:37:29<3:09:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5268/15526 [1:37:30<3:09:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5268/15526 [1:37:30<3:09:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5269/15526 [1:37:31<3:09:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5269/15526 [1:37:31<3:09:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5270/15526 [1:37:31<3:09:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5270/15526 [1:37:31<3:09:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5271/15526 [1:37:32<3:09:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5271/15526 [1:37:32<3:09:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5272/15526 [1:37:33<3:09:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5272/15526 [1:37:33<3:09:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5273/15526 [1:37:34<3:09:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5273/15526 [1:37:34<3:09:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5274/15526 [1:37:35<3:09:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5274/15526 [1:37:35<3:09:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5275/15526 [1:37:35<3:09:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5275/15526 [1:37:35<3:09:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5276/15526 [1:37:36<3:09:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5276/15526 [1:37:36<3:09:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5277/15526 [1:37:37<3:09:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5277/15526 [1:37:37<3:09:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5278/15526 [1:37:38<3:09:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5278/15526 [1:37:38<3:09:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5279/15526 [1:37:39<3:09:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5279/15526 [1:37:39<3:09:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5280/15526 [1:37:47<3:09:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5280/15526 [1:37:47<3:09:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5281/15526 [1:37:48<3:09:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5281/15526 [1:37:48<3:09:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5282/15526 [1:37:49<3:09:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5282/15526 [1:37:49<3:09:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5283/15526 [1:37:50<3:09:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5283/15526 [1:37:50<3:09:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5284/15526 [1:37:50<3:09:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5284/15526 [1:37:50<3:09:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5285/15526 [1:37:51<3:09:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5285/15526 [1:37:51<3:09:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5286/15526 [1:37:52<3:09:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5286/15526 [1:37:52<3:09:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5287/15526 [1:37:53<3:09:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5287/15526 [1:37:53<3:09:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5288/15526 [1:37:54<3:09:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5288/15526 [1:37:54<3:09:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5289/15526 [1:37:54<3:09:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5289/15526 [1:37:54<3:09:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5290/15526 [1:37:55<3:09:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5290/15526 [1:37:55<3:09:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5291/15526 [1:37:56<3:09:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5291/15526 [1:37:56<3:09:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5292/15526 [1:37:57<3:09:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5292/15526 [1:37:57<3:09:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5293/15526 [1:37:58<3:09:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5293/15526 [1:37:58<3:09:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5294/15526 [1:37:59<3:09:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5294/15526 [1:37:59<3:09:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5295/15526 [1:38:00<3:09:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5295/15526 [1:38:00<3:09:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5296/15526 [1:38:00<3:09:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5296/15526 [1:38:00<3:09:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5297/15526 [1:38:01<3:09:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5297/15526 [1:38:01<3:09:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5298/15526 [1:38:02<3:09:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5298/15526 [1:38:02<3:09:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5299/15526 [1:38:03<3:09:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5299/15526 [1:38:03<3:09:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5300/15526 [1:38:04<3:09:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5300/15526 [1:38:04<3:09:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5301/15526 [1:38:04<3:09:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5301/15526 [1:38:04<3:09:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5302/15526 [1:38:05<3:09:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5302/15526 [1:38:05<3:09:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|��| 5303/15526 [1:38:06<3:09:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5303/15526 [1:38:06<3:09:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5304/15526 [1:38:07<3:09:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5304/15526 [1:38:07<3:09:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5305/15526 [1:38:08<3:09:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5305/15526 [1:38:08<3:09:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5306/15526 [1:38:09<3:09:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5306/15526 [1:38:09<3:09:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5307/15526 [1:38:10<3:09:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5307/15526 [1:38:10<3:09:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5308/15526 [1:38:11<3:09:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5308/15526 [1:38:11<3:09:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5309/15526 [1:38:11<3:08:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5309/15526 [1:38:11<3:08:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5310/15526 [1:38:12<3:08:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5310/15526 [1:38:12<3:08:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5311/15526 [1:38:13<3:08:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5311/15526 [1:38:13<3:08:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5312/15526 [1:38:24<3:09:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5312/15526 [1:38:24<3:09:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5313/15526 [1:38:26<3:09:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5313/15526 [1:38:26<3:09:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5314/15526 [1:38:26<3:09:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5314/15526 [1:38:26<3:09:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5315/15526 [1:38:27<3:09:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5315/15526 [1:38:27<3:09:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5316/15526 [1:38:28<3:09:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5316/15526 [1:38:28<3:09:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5317/15526 [1:38:29<3:09:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5317/15526 [1:38:29<3:09:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5318/15526 [1:38:30<3:09:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5318/15526 [1:38:30<3:09:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5319/15526 [1:38:31<3:09:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5319/15526 [1:38:31<3:09:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5320/15526 [1:38:32<3:09:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5320/15526 [1:38:32<3:09:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5321/15526 [1:38:32<3:09:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5321/15526 [1:38:32<3:09:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5322/15526 [1:38:33<3:08:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5322/15526 [1:38:33<3:08:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5323/15526 [1:38:34<3:08:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5323/15526 [1:38:34<3:08:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5324/15526 [1:38:36<3:08:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5324/15526 [1:38:36<3:08:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5325/15526 [1:38:37<3:08:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5325/15526 [1:38:37<3:08:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5326/15526 [1:38:38<3:08:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5326/15526 [1:38:38<3:08:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5327/15526 [1:38:39<3:08:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5327/15526 [1:38:39<3:08:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5328/15526 [1:38:39<3:08:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5328/15526 [1:38:39<3:08:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5329/15526 [1:38:41<3:08:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5329/15526 [1:38:41<3:08:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5330/15526 [1:38:42<3:08:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5330/15526 [1:38:42<3:08:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5331/15526 [1:38:42<3:08:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5331/15526 [1:38:43<3:08:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5332/15526 [1:38:43<3:08:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5332/15526 [1:38:43<3:08:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5333/15526 [1:38:44<3:08:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5333/15526 [1:38:44<3:08:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5334/15526 [1:38:45<3:08:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5334/15526 [1:38:45<3:08:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5335/15526 [1:38:45<3:08:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5335/15526 [1:38:45<3:08:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5336/15526 [1:38:46<3:08:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5336/15526 [1:38:46<3:08:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5337/15526 [1:38:47<3:08:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5337/15526 [1:38:47<3:08:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5338/15526 [1:38:48<3:08:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5338/15526 [1:38:48<3:08:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5339/15526 [1:38:48<3:08:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5339/15526 [1:38:48<3:08:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5340/15526 [1:38:49<3:08:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5340/15526 [1:38:49<3:08:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5341/15526 [1:38:50<3:08:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5341/15526 [1:38:50<3:08:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5342/15526 [1:38:51<3:08:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5342/15526 [1:38:51<3:08:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5343/15526 [1:38:53<3:08:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5343/15526 [1:38:53<3:08:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5344/15526 [1:38:59<3:08:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5344/15526 [1:38:59<3:08:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5345/15526 [1:38:59<3:08:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5345/15526 [1:38:59<3:08:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5346/15526 [1:39:00<3:08:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5346/15526 [1:39:00<3:08:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5347/15526 [1:39:01<3:08:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5347/15526 [1:39:01<3:08:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5348/15526 [1:39:01<3:08:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5348/15526 [1:39:01<3:08:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5349/15526 [1:39:02<3:08:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5349/15526 [1:39:02<3:08:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5350/15526 [1:39:03<3:08:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5350/15526 [1:39:03<3:08:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5351/15526 [1:39:04<3:08:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5351/15526 [1:39:04<3:08:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5352/15526 [1:39:05<3:08:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5352/15526 [1:39:05<3:08:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5353/15526 [1:39:06<3:08:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5353/15526 [1:39:06<3:08:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5354/15526 [1:39:06<3:08:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5354/15526 [1:39:06<3:08:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5355/15526 [1:39:07<3:08:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5355/15526 [1:39:07<3:08:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 5356/15526 [1:39:08<3:08:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  34%|▎| 5356/15526 [1:39:08<3:08:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5357/15526 [1:39:09<3:08:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5357/15526 [1:39:09<3:08:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5358/15526 [1:39:10<3:08:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5358/15526 [1:39:10<3:08:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5359/15526 [1:39:11<3:08:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5359/15526 [1:39:11<3:08:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5360/15526 [1:39:12<3:08:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5360/15526 [1:39:12<3:08:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5361/15526 [1:39:13<3:08:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5361/15526 [1:39:13<3:08:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5362/15526 [1:39:13<3:08:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5362/15526 [1:39:13<3:08:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5363/15526 [1:39:15<3:08:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5363/15526 [1:39:15<3:08:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5364/15526 [1:39:16<3:08:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5364/15526 [1:39:16<3:08:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5365/15526 [1:39:17<3:08:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5365/15526 [1:39:17<3:08:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5366/15526 [1:39:17<3:08:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5366/15526 [1:39:17<3:08:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5367/15526 [1:39:18<3:07:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5367/15526 [1:39:18<3:07:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5368/15526 [1:39:19<3:07:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5368/15526 [1:39:19<3:07:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5369/15526 [1:39:20<3:07:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5369/15526 [1:39:20<3:07:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5370/15526 [1:39:21<3:07:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5370/15526 [1:39:21<3:07:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5371/15526 [1:39:22<3:07:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5371/15526 [1:39:22<3:07:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5372/15526 [1:39:23<3:07:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5372/15526 [1:39:23<3:07:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5373/15526 [1:39:24<3:07:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5373/15526 [1:39:24<3:07:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5374/15526 [1:39:25<3:07:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5374/15526 [1:39:25<3:07:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5375/15526 [1:39:26<3:07:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5375/15526 [1:39:26<3:07:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5376/15526 [1:39:33<3:07:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5376/15526 [1:39:33<3:07:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5377/15526 [1:39:34<3:07:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5377/15526 [1:39:34<3:07:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5378/15526 [1:39:35<3:07:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5378/15526 [1:39:35<3:07:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5379/15526 [1:39:36<3:07:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5379/15526 [1:39:36<3:07:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5380/15526 [1:39:37<3:07:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5380/15526 [1:39:37<3:07:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5381/15526 [1:39:37<3:07:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5381/15526 [1:39:37<3:07:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5382/15526 [1:39:38<3:07:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5382/15526 [1:39:38<3:07:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5383/15526 [1:39:39<3:07:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5383/15526 [1:39:39<3:07:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5384/15526 [1:39:40<3:07:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5384/15526 [1:39:40<3:07:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5385/15526 [1:39:42<3:07:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5385/15526 [1:39:42<3:07:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5386/15526 [1:39:43<3:07:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5386/15526 [1:39:43<3:07:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5387/15526 [1:39:43<3:07:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5387/15526 [1:39:43<3:07:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5388/15526 [1:39:44<3:07:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5388/15526 [1:39:44<3:07:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5389/15526 [1:39:45<3:07:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5389/15526 [1:39:45<3:07:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5390/15526 [1:39:45<3:07:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5390/15526 [1:39:45<3:07:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5391/15526 [1:39:46<3:07:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5391/15526 [1:39:46<3:07:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5392/15526 [1:39:47<3:07:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5392/15526 [1:39:47<3:07:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5393/15526 [1:39:48<3:07:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5393/15526 [1:39:48<3:07:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5394/15526 [1:39:49<3:07:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5394/15526 [1:39:49<3:07:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5395/15526 [1:39:50<3:07:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5395/15526 [1:39:50<3:07:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5396/15526 [1:39:51<3:07:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5396/15526 [1:39:51<3:07:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5397/15526 [1:39:52<3:07:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5397/15526 [1:39:52<3:07:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5398/15526 [1:39:53<3:07:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5398/15526 [1:39:53<3:07:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5399/15526 [1:39:54<3:07:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5399/15526 [1:39:54<3:07:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5400/15526 [1:39:55<3:07:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5400/15526 [1:39:55<3:07:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5401/15526 [1:39:56<3:07:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5401/15526 [1:39:56<3:07:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5402/15526 [1:39:56<3:07:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5402/15526 [1:39:56<3:07:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5403/15526 [1:39:57<3:07:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5403/15526 [1:39:57<3:07:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5404/15526 [1:39:58<3:07:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5404/15526 [1:39:58<3:07:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5405/15526 [1:39:59<3:07:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5405/15526 [1:39:59<3:07:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5406/15526 [1:39:59<3:07:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5406/15526 [1:39:59<3:07:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5407/15526 [1:40:00<3:07:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5407/15526 [1:40:00<3:07:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5408/15526 [1:40:08<3:07:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5408/15526 [1:40:08<3:07:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5409/15526 [1:40:09<3:07:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5409/15526 [1:40:09<3:07:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5410/15526 [1:40:10<3:07:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5410/15526 [1:40:10<3:07:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5411/15526 [1:40:10<3:07:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5411/15526 [1:40:10<3:07:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5412/15526 [1:40:11<3:07:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5412/15526 [1:40:11<3:07:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5413/15526 [1:40:12<3:07:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5413/15526 [1:40:12<3:07:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5414/15526 [1:40:13<3:07:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5414/15526 [1:40:13<3:07:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5415/15526 [1:40:14<3:07:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5415/15526 [1:40:14<3:07:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5416/15526 [1:40:14<3:07:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5416/15526 [1:40:14<3:07:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5417/15526 [1:40:15<3:07:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5417/15526 [1:40:15<3:07:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5418/15526 [1:40:16<3:07:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5418/15526 [1:40:16<3:07:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5419/15526 [1:40:17<3:07:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5419/15526 [1:40:17<3:07:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5420/15526 [1:40:18<3:07:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5420/15526 [1:40:18<3:07:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5421/15526 [1:40:18<3:06:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5421/15526 [1:40:18<3:06:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5422/15526 [1:40:20<3:06:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5422/15526 [1:40:20<3:06:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5423/15526 [1:40:20<3:06:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5423/15526 [1:40:20<3:06:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5424/15526 [1:40:21<3:06:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5424/15526 [1:40:21<3:06:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5425/15526 [1:40:22<3:06:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5425/15526 [1:40:22<3:06:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5426/15526 [1:40:23<3:06:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5426/15526 [1:40:23<3:06:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5427/15526 [1:40:24<3:06:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5427/15526 [1:40:24<3:06:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5428/15526 [1:40:26<3:06:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5428/15526 [1:40:26<3:06:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5429/15526 [1:40:26<3:06:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5429/15526 [1:40:26<3:06:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5430/15526 [1:40:27<3:06:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5430/15526 [1:40:27<3:06:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5431/15526 [1:40:28<3:06:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5431/15526 [1:40:28<3:06:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5432/15526 [1:40:28<3:06:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5432/15526 [1:40:28<3:06:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5433/15526 [1:40:29<3:06:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5433/15526 [1:40:29<3:06:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5434/15526 [1:40:30<3:06:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5434/15526 [1:40:30<3:06:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5435/15526 [1:40:31<3:06:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5435/15526 [1:40:31<3:06:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5436/15526 [1:40:32<3:06:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5436/15526 [1:40:32<3:06:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5437/15526 [1:40:32<3:06:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5437/15526 [1:40:32<3:06:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5438/15526 [1:40:33<3:06:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5438/15526 [1:40:33<3:06:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5439/15526 [1:40:34<3:06:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5439/15526 [1:40:34<3:06:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5440/15526 [1:40:42<3:06:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5440/15526 [1:40:42<3:06:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5441/15526 [1:40:43<3:06:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5441/15526 [1:40:43<3:06:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5442/15526 [1:40:44<3:06:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5442/15526 [1:40:44<3:06:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5443/15526 [1:40:45<3:06:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5443/15526 [1:40:45<3:06:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5444/15526 [1:40:46<3:06:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5444/15526 [1:40:46<3:06:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5445/15526 [1:40:46<3:06:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5445/15526 [1:40:46<3:06:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5446/15526 [1:40:47<3:06:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5446/15526 [1:40:47<3:06:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5447/15526 [1:40:48<3:06:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5447/15526 [1:40:48<3:06:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5448/15526 [1:40:49<3:06:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5448/15526 [1:40:49<3:06:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5449/15526 [1:40:50<3:06:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5449/15526 [1:40:50<3:06:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5450/15526 [1:40:51<3:06:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5450/15526 [1:40:51<3:06:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5451/15526 [1:40:51<3:06:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5451/15526 [1:40:51<3:06:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5452/15526 [1:40:53<3:06:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5452/15526 [1:40:53<3:06:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5453/15526 [1:40:53<3:06:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5453/15526 [1:40:53<3:06:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5454/15526 [1:40:54<3:06:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5454/15526 [1:40:54<3:06:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5455/15526 [1:40:55<3:06:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5455/15526 [1:40:55<3:06:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5456/15526 [1:40:56<3:06:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5456/15526 [1:40:56<3:06:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5457/15526 [1:40:56<3:06:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5457/15526 [1:40:56<3:06:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5458/15526 [1:40:57<3:06:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5458/15526 [1:40:57<3:06:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5459/15526 [1:40:58<3:06:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5459/15526 [1:40:58<3:06:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5460/15526 [1:40:58<3:06:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5460/15526 [1:40:58<3:06:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5461/15526 [1:40:59<3:06:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5461/15526 [1:40:59<3:06:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5462/15526 [1:41:00<3:06:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5462/15526 [1:41:00<3:06:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5463/15526 [1:41:01<3:06:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5463/15526 [1:41:01<3:06:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5464/15526 [1:41:02<3:06:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5464/15526 [1:41:02<3:06:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5465/15526 [1:41:03<3:06:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5465/15526 [1:41:03<3:06:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5466/15526 [1:41:03<3:06:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5466/15526 [1:41:03<3:06:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5467/15526 [1:41:04<3:05:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5467/15526 [1:41:04<3:05:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5468/15526 [1:41:05<3:05:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5468/15526 [1:41:05<3:05:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5469/15526 [1:41:06<3:05:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5469/15526 [1:41:06<3:05:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5470/15526 [1:41:07<3:05:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5470/15526 [1:41:07<3:05:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5471/15526 [1:41:08<3:05:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5471/15526 [1:41:08<3:05:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5472/15526 [1:41:15<3:06:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5472/15526 [1:41:15<3:06:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5473/15526 [1:41:16<3:06:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5473/15526 [1:41:16<3:06:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5474/15526 [1:41:17<3:06:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5474/15526 [1:41:17<3:06:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5475/15526 [1:41:18<3:05:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5475/15526 [1:41:18<3:05:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5476/15526 [1:41:19<3:05:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5476/15526 [1:41:19<3:05:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5477/15526 [1:41:20<3:05:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5477/15526 [1:41:20<3:05:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5478/15526 [1:41:20<3:05:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5478/15526 [1:41:20<3:05:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5479/15526 [1:41:21<3:05:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5479/15526 [1:41:21<3:05:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5480/15526 [1:41:22<3:05:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5480/15526 [1:41:22<3:05:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5481/15526 [1:41:23<3:05:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5481/15526 [1:41:23<3:05:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5482/15526 [1:41:24<3:05:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5482/15526 [1:41:24<3:05:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5483/15526 [1:41:25<3:05:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5483/15526 [1:41:25<3:05:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5484/15526 [1:41:26<3:05:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5484/15526 [1:41:26<3:05:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5485/15526 [1:41:27<3:05:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5485/15526 [1:41:27<3:05:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5486/15526 [1:41:27<3:05:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5486/15526 [1:41:27<3:05:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5487/15526 [1:41:28<3:05:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5487/15526 [1:41:28<3:05:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5488/15526 [1:41:29<3:05:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5488/15526 [1:41:29<3:05:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5489/15526 [1:41:30<3:05:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5489/15526 [1:41:30<3:05:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5490/15526 [1:41:31<3:05:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5490/15526 [1:41:31<3:05:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5491/15526 [1:41:31<3:05:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5491/15526 [1:41:31<3:05:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5492/15526 [1:41:32<3:05:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5492/15526 [1:41:32<3:05:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5493/15526 [1:41:33<3:05:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5493/15526 [1:41:33<3:05:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5494/15526 [1:41:34<3:05:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5494/15526 [1:41:34<3:05:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5495/15526 [1:41:34<3:05:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5495/15526 [1:41:34<3:05:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5496/15526 [1:41:36<3:05:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5496/15526 [1:41:36<3:05:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5497/15526 [1:41:36<3:05:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5497/15526 [1:41:36<3:05:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5498/15526 [1:41:37<3:05:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5498/15526 [1:41:37<3:05:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5499/15526 [1:41:38<3:05:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5499/15526 [1:41:38<3:05:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5500/15526 [1:41:38<3:05:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5500/15526 [1:41:38<3:05:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5501/15526 [1:41:39<3:05:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5501/15526 [1:41:39<3:05:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5502/15526 [1:41:40<3:05:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5502/15526 [1:41:40<3:05:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5503/15526 [1:41:40<3:05:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5503/15526 [1:41:40<3:05:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5504/15526 [1:41:50<3:05:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5504/15526 [1:41:50<3:05:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5505/15526 [1:41:50<3:05:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5505/15526 [1:41:50<3:05:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5506/15526 [1:41:51<3:05:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5506/15526 [1:41:51<3:05:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5507/15526 [1:41:52<3:05:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5507/15526 [1:41:52<3:05:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5508/15526 [1:41:53<3:05:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5508/15526 [1:41:53<3:05:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5509/15526 [1:41:54<3:05:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5509/15526 [1:41:54<3:05:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5510/15526 [1:41:54<3:05:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5510/15526 [1:41:54<3:05:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 5511/15526 [1:41:55<3:05:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  35%|▎| 5511/15526 [1:41:55<3:05:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5512/15526 [1:41:56<3:05:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5512/15526 [1:41:56<3:05:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5513/15526 [1:41:57<3:05:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5513/15526 [1:41:57<3:05:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5514/15526 [1:41:57<3:05:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5514/15526 [1:41:57<3:05:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5515/15526 [1:41:58<3:05:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5515/15526 [1:41:58<3:05:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5516/15526 [1:41:59<3:05:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5516/15526 [1:41:59<3:05:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5517/15526 [1:42:00<3:05:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5517/15526 [1:42:00<3:05:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5518/15526 [1:42:01<3:05:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5518/15526 [1:42:01<3:05:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5519/15526 [1:42:02<3:05:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5519/15526 [1:42:02<3:05:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5520/15526 [1:42:03<3:05:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5520/15526 [1:42:03<3:05:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5521/15526 [1:42:04<3:04:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5521/15526 [1:42:04<3:04:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5522/15526 [1:42:04<3:04:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5522/15526 [1:42:04<3:04:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5523/15526 [1:42:05<3:04:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5523/15526 [1:42:05<3:04:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5524/15526 [1:42:06<3:04:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5524/15526 [1:42:06<3:04:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5525/15526 [1:42:07<3:04:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5525/15526 [1:42:07<3:04:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5526/15526 [1:42:08<3:04:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5526/15526 [1:42:08<3:04:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5527/15526 [1:42:09<3:04:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5527/15526 [1:42:09<3:04:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5528/15526 [1:42:10<3:04:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5528/15526 [1:42:10<3:04:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5529/15526 [1:42:10<3:04:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5529/15526 [1:42:10<3:04:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5530/15526 [1:42:11<3:04:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5530/15526 [1:42:11<3:04:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5531/15526 [1:42:12<3:04:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5531/15526 [1:42:12<3:04:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5532/15526 [1:42:12<3:04:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5532/15526 [1:42:12<3:04:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5533/15526 [1:42:13<3:04:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5533/15526 [1:42:13<3:04:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5534/15526 [1:42:14<3:04:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5534/15526 [1:42:14<3:04:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5535/15526 [1:42:14<3:04:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5535/15526 [1:42:14<3:04:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5536/15526 [1:42:25<3:04:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5536/15526 [1:42:25<3:04:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5537/15526 [1:42:26<3:04:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5537/15526 [1:42:26<3:04:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5538/15526 [1:42:26<3:04:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5538/15526 [1:42:26<3:04:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5539/15526 [1:42:27<3:04:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5539/15526 [1:42:27<3:04:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5540/15526 [1:42:28<3:04:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5540/15526 [1:42:28<3:04:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5541/15526 [1:42:28<3:04:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5541/15526 [1:42:28<3:04:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5542/15526 [1:42:30<3:04:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5542/15526 [1:42:30<3:04:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5543/15526 [1:42:30<3:04:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5543/15526 [1:42:30<3:04:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5544/15526 [1:42:31<3:04:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5544/15526 [1:42:31<3:04:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5545/15526 [1:42:32<3:04:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5545/15526 [1:42:32<3:04:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5546/15526 [1:42:32<3:04:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5546/15526 [1:42:32<3:04:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5547/15526 [1:42:34<3:04:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5547/15526 [1:42:34<3:04:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5548/15526 [1:42:35<3:04:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5548/15526 [1:42:35<3:04:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5549/15526 [1:42:35<3:04:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5549/15526 [1:42:35<3:04:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5550/15526 [1:42:36<3:04:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5550/15526 [1:42:36<3:04:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5551/15526 [1:42:37<3:04:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5551/15526 [1:42:37<3:04:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5552/15526 [1:42:39<3:04:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5552/15526 [1:42:39<3:04:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5553/15526 [1:42:40<3:04:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5553/15526 [1:42:40<3:04:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5554/15526 [1:42:40<3:04:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5554/15526 [1:42:40<3:04:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5555/15526 [1:42:42<3:04:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5555/15526 [1:42:42<3:04:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5556/15526 [1:42:43<3:04:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5556/15526 [1:42:43<3:04:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5557/15526 [1:42:44<3:04:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5557/15526 [1:42:44<3:04:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5558/15526 [1:42:45<3:04:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5558/15526 [1:42:45<3:04:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5559/15526 [1:42:46<3:04:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5559/15526 [1:42:46<3:04:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5560/15526 [1:42:47<3:04:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5560/15526 [1:42:47<3:04:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5561/15526 [1:42:47<3:04:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5561/15526 [1:42:47<3:04:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5562/15526 [1:42:48<3:04:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5562/15526 [1:42:48<3:04:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5563/15526 [1:42:49<3:04:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5563/15526 [1:42:49<3:04:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5564/15526 [1:42:50<3:04:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5564/15526 [1:42:50<3:04:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5565/15526 [1:42:51<3:04:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5565/15526 [1:42:51<3:04:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5566/15526 [1:42:52<3:04:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5566/15526 [1:42:52<3:04:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5567/15526 [1:42:52<3:04:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5567/15526 [1:42:52<3:04:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5568/15526 [1:42:59<3:04:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5568/15526 [1:42:59<3:04:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5569/15526 [1:43:00<3:04:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5569/15526 [1:43:00<3:04:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5570/15526 [1:43:00<3:04:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5570/15526 [1:43:00<3:04:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5571/15526 [1:43:01<3:04:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5571/15526 [1:43:01<3:04:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5572/15526 [1:43:02<3:04:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5572/15526 [1:43:02<3:04:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5573/15526 [1:43:03<3:04:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5573/15526 [1:43:03<3:04:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5574/15526 [1:43:04<3:04:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5574/15526 [1:43:04<3:04:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5575/15526 [1:43:04<3:03:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5575/15526 [1:43:04<3:03:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5576/15526 [1:43:05<3:03:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5576/15526 [1:43:05<3:03:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5577/15526 [1:43:06<3:03:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5577/15526 [1:43:06<3:03:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5578/15526 [1:43:06<3:03:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5578/15526 [1:43:06<3:03:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5579/15526 [1:43:08<3:03:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5579/15526 [1:43:08<3:03:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5580/15526 [1:43:09<3:03:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5580/15526 [1:43:09<3:03:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5581/15526 [1:43:10<3:03:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5581/15526 [1:43:10<3:03:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5582/15526 [1:43:11<3:03:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5582/15526 [1:43:11<3:03:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5583/15526 [1:43:12<3:03:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5583/15526 [1:43:12<3:03:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5584/15526 [1:43:13<3:03:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5584/15526 [1:43:13<3:03:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5585/15526 [1:43:13<3:03:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5585/15526 [1:43:13<3:03:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5586/15526 [1:43:14<3:03:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5586/15526 [1:43:14<3:03:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5587/15526 [1:43:15<3:03:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5587/15526 [1:43:15<3:03:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5588/15526 [1:43:16<3:03:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5588/15526 [1:43:16<3:03:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5589/15526 [1:43:16<3:03:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5589/15526 [1:43:16<3:03:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5590/15526 [1:43:17<3:03:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5590/15526 [1:43:17<3:03:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5591/15526 [1:43:18<3:03:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5591/15526 [1:43:18<3:03:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5592/15526 [1:43:19<3:03:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5592/15526 [1:43:19<3:03:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5593/15526 [1:43:20<3:03:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5593/15526 [1:43:20<3:03:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5594/15526 [1:43:21<3:03:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5594/15526 [1:43:21<3:03:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5595/15526 [1:43:22<3:03:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5595/15526 [1:43:22<3:03:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5596/15526 [1:43:23<3:03:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5596/15526 [1:43:23<3:03:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5597/15526 [1:43:24<3:03:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5597/15526 [1:43:24<3:03:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5598/15526 [1:43:25<3:03:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5598/15526 [1:43:25<3:03:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5599/15526 [1:43:26<3:03:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5599/15526 [1:43:26<3:03:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5600/15526 [1:43:33<3:03:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5600/15526 [1:43:33<3:03:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5601/15526 [1:43:55<3:04:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5601/15526 [1:43:55<3:04:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5602/15526 [1:43:56<3:04:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5602/15526 [1:43:56<3:04:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5603/15526 [1:43:57<3:04:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5603/15526 [1:43:57<3:04:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5604/15526 [1:43:57<3:04:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5604/15526 [1:43:57<3:04:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5605/15526 [1:43:58<3:04:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5605/15526 [1:43:58<3:04:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5606/15526 [1:43:59<3:04:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5606/15526 [1:43:59<3:04:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5607/15526 [1:43:59<3:03:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5607/15526 [1:43:59<3:03:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5608/15526 [1:44:00<3:03:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5608/15526 [1:44:00<3:03:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5609/15526 [1:44:01<3:03:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5609/15526 [1:44:01<3:03:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5610/15526 [1:44:01<3:03:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5610/15526 [1:44:01<3:03:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5611/15526 [1:44:02<3:03:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5611/15526 [1:44:02<3:03:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5612/15526 [1:44:03<3:03:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5612/15526 [1:44:03<3:03:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5613/15526 [1:44:04<3:03:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5613/15526 [1:44:04<3:03:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5614/15526 [1:44:04<3:03:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5614/15526 [1:44:04<3:03:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5615/15526 [1:44:05<3:03:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5615/15526 [1:44:05<3:03:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5616/15526 [1:44:06<3:03:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5616/15526 [1:44:06<3:03:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5617/15526 [1:44:07<3:03:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5617/15526 [1:44:07<3:03:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5618/15526 [1:44:08<3:03:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5618/15526 [1:44:08<3:03:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5619/15526 [1:44:09<3:03:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5619/15526 [1:44:09<3:03:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5620/15526 [1:44:10<3:03:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5620/15526 [1:44:10<3:03:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5621/15526 [1:44:11<3:03:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5621/15526 [1:44:11<3:03:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5622/15526 [1:44:12<3:03:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5622/15526 [1:44:12<3:03:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5623/15526 [1:44:13<3:03:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5623/15526 [1:44:13<3:03:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5624/15526 [1:44:14<3:03:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5624/15526 [1:44:14<3:03:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5625/15526 [1:44:14<3:03:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5625/15526 [1:44:14<3:03:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5626/15526 [1:44:15<3:03:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5626/15526 [1:44:15<3:03:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5627/15526 [1:44:16<3:03:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5627/15526 [1:44:16<3:03:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5628/15526 [1:44:16<3:03:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5628/15526 [1:44:16<3:03:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5629/15526 [1:44:17<3:03:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5629/15526 [1:44:17<3:03:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5630/15526 [1:44:18<3:03:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5630/15526 [1:44:18<3:03:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5631/15526 [1:44:19<3:03:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5631/15526 [1:44:19<3:03:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5632/15526 [1:44:30<3:03:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5632/15526 [1:44:30<3:03:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5633/15526 [1:44:31<3:03:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5633/15526 [1:44:31<3:03:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5634/15526 [1:44:32<3:03:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5634/15526 [1:44:32<3:03:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5635/15526 [1:44:32<3:03:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5635/15526 [1:44:32<3:03:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5636/15526 [1:44:33<3:03:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5636/15526 [1:44:33<3:03:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5637/15526 [1:44:34<3:03:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5637/15526 [1:44:34<3:03:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5638/15526 [1:44:35<3:03:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5638/15526 [1:44:35<3:03:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5639/15526 [1:44:36<3:03:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5639/15526 [1:44:36<3:03:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5640/15526 [1:44:36<3:03:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5640/15526 [1:44:36<3:03:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5641/15526 [1:44:37<3:03:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5641/15526 [1:44:37<3:03:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5642/15526 [1:44:38<3:03:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5642/15526 [1:44:38<3:03:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5643/15526 [1:44:39<3:03:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5643/15526 [1:44:39<3:03:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5644/15526 [1:44:40<3:03:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5644/15526 [1:44:40<3:03:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5645/15526 [1:44:41<3:03:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5645/15526 [1:44:41<3:03:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5646/15526 [1:44:42<3:03:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5646/15526 [1:44:42<3:03:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5647/15526 [1:44:43<3:03:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5647/15526 [1:44:43<3:03:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5648/15526 [1:44:44<3:03:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5648/15526 [1:44:44<3:03:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5649/15526 [1:44:45<3:03:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5649/15526 [1:44:45<3:03:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5650/15526 [1:44:45<3:03:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5650/15526 [1:44:45<3:03:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5651/15526 [1:44:46<3:03:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5651/15526 [1:44:46<3:03:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5652/15526 [1:44:47<3:03:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5652/15526 [1:44:47<3:03:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5653/15526 [1:44:47<3:03:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5653/15526 [1:44:47<3:03:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5654/15526 [1:44:48<3:02:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5654/15526 [1:44:48<3:02:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5655/15526 [1:44:49<3:02:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5655/15526 [1:44:49<3:02:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5656/15526 [1:44:50<3:02:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5656/15526 [1:44:50<3:02:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5657/15526 [1:44:51<3:02:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5657/15526 [1:44:51<3:02:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5658/15526 [1:44:51<3:02:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5658/15526 [1:44:51<3:02:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5659/15526 [1:44:52<3:02:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5659/15526 [1:44:52<3:02:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5660/15526 [1:44:54<3:02:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5660/15526 [1:44:54<3:02:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5661/15526 [1:44:55<3:02:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5661/15526 [1:44:55<3:02:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5662/15526 [1:44:56<3:02:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5662/15526 [1:44:56<3:02:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5663/15526 [1:44:56<3:02:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5663/15526 [1:44:56<3:02:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5664/15526 [1:45:04<3:02:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5664/15526 [1:45:04<3:02:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5665/15526 [1:45:05<3:02:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5665/15526 [1:45:05<3:02:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 5666/15526 [1:45:05<3:02:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  36%|▎| 5666/15526 [1:45:05<3:02:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5667/15526 [1:45:06<3:02:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5667/15526 [1:45:06<3:02:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5668/15526 [1:45:07<3:02:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5668/15526 [1:45:07<3:02:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5669/15526 [1:45:07<3:02:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5669/15526 [1:45:07<3:02:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5670/15526 [1:45:08<3:02:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5670/15526 [1:45:08<3:02:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5671/15526 [1:45:09<3:02:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5671/15526 [1:45:09<3:02:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5672/15526 [1:45:10<3:02:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5672/15526 [1:45:10<3:02:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5673/15526 [1:45:11<3:02:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5673/15526 [1:45:11<3:02:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5674/15526 [1:45:11<3:02:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5674/15526 [1:45:11<3:02:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5675/15526 [1:45:12<3:02:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5675/15526 [1:45:12<3:02:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5676/15526 [1:45:13<3:02:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5676/15526 [1:45:13<3:02:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5677/15526 [1:45:14<3:02:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5677/15526 [1:45:14<3:02:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5678/15526 [1:45:15<3:02:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5678/15526 [1:45:15<3:02:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5679/15526 [1:45:16<3:02:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5679/15526 [1:45:16<3:02:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5680/15526 [1:45:17<3:02:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5680/15526 [1:45:17<3:02:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5681/15526 [1:45:18<3:02:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5681/15526 [1:45:18<3:02:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5682/15526 [1:45:18<3:02:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5682/15526 [1:45:18<3:02:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5683/15526 [1:45:19<3:02:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5683/15526 [1:45:19<3:02:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5684/15526 [1:45:20<3:02:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5684/15526 [1:45:20<3:02:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5685/15526 [1:45:21<3:02:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5685/15526 [1:45:21<3:02:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5686/15526 [1:45:21<3:02:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5686/15526 [1:45:21<3:02:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5687/15526 [1:45:22<3:02:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5687/15526 [1:45:22<3:02:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5688/15526 [1:45:24<3:02:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5688/15526 [1:45:24<3:02:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5689/15526 [1:45:25<3:02:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5689/15526 [1:45:25<3:02:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5690/15526 [1:45:25<3:02:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5690/15526 [1:45:25<3:02:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5691/15526 [1:45:26<3:02:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5691/15526 [1:45:26<3:02:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5692/15526 [1:45:27<3:02:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5692/15526 [1:45:27<3:02:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5693/15526 [1:45:28<3:02:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5693/15526 [1:45:28<3:02:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5694/15526 [1:45:28<3:02:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5694/15526 [1:45:28<3:02:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5695/15526 [1:45:29<3:02:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5695/15526 [1:45:29<3:02:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5696/15526 [1:45:38<3:02:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5696/15526 [1:45:38<3:02:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5697/15526 [1:45:39<3:02:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5697/15526 [1:45:39<3:02:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5698/15526 [1:45:39<3:02:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5698/15526 [1:45:39<3:02:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5699/15526 [1:45:40<3:02:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5699/15526 [1:45:40<3:02:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5700/15526 [1:45:41<3:02:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5700/15526 [1:45:41<3:02:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5701/15526 [1:45:42<3:02:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5701/15526 [1:45:42<3:02:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5702/15526 [1:45:43<3:02:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5702/15526 [1:45:43<3:02:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5703/15526 [1:45:44<3:02:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5703/15526 [1:45:44<3:02:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5704/15526 [1:45:44<3:02:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5704/15526 [1:45:44<3:02:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5705/15526 [1:45:46<3:02:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5705/15526 [1:45:46<3:02:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5706/15526 [1:45:46<3:02:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5706/15526 [1:45:46<3:02:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5707/15526 [1:45:47<3:02:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5707/15526 [1:45:47<3:02:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5708/15526 [1:45:49<3:02:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5708/15526 [1:45:49<3:02:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5709/15526 [1:45:49<3:01:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5709/15526 [1:45:49<3:01:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5710/15526 [1:45:51<3:01:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5710/15526 [1:45:51<3:01:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5711/15526 [1:45:51<3:01:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5711/15526 [1:45:51<3:01:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5712/15526 [1:45:52<3:01:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5712/15526 [1:45:52<3:01:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5713/15526 [1:45:53<3:01:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5713/15526 [1:45:53<3:01:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5714/15526 [1:45:54<3:01:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5714/15526 [1:45:54<3:01:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5715/15526 [1:45:55<3:01:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5715/15526 [1:45:55<3:01:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5716/15526 [1:45:56<3:01:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5716/15526 [1:45:56<3:01:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5717/15526 [1:45:56<3:01:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5717/15526 [1:45:56<3:01:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5718/15526 [1:45:57<3:01:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5718/15526 [1:45:57<3:01:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5719/15526 [1:45:58<3:01:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5719/15526 [1:45:58<3:01:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5720/15526 [1:45:59<3:01:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5720/15526 [1:45:59<3:01:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5721/15526 [1:46:00<3:01:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5721/15526 [1:46:00<3:01:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5722/15526 [1:46:01<3:01:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5722/15526 [1:46:01<3:01:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5723/15526 [1:46:02<3:01:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5723/15526 [1:46:02<3:01:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5724/15526 [1:46:02<3:01:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5724/15526 [1:46:02<3:01:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5725/15526 [1:46:04<3:01:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5725/15526 [1:46:04<3:01:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5726/15526 [1:46:04<3:01:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5726/15526 [1:46:04<3:01:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5727/15526 [1:46:05<3:01:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5727/15526 [1:46:05<3:01:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5728/15526 [1:46:12<3:01:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5728/15526 [1:46:12<3:01:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5729/15526 [1:46:13<3:01:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5729/15526 [1:46:13<3:01:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5730/15526 [1:46:14<3:01:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5730/15526 [1:46:14<3:01:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5731/15526 [1:46:15<3:01:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5731/15526 [1:46:15<3:01:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5732/15526 [1:46:15<3:01:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5732/15526 [1:46:15<3:01:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5733/15526 [1:46:16<3:01:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5733/15526 [1:46:16<3:01:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5734/15526 [1:46:17<3:01:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5734/15526 [1:46:17<3:01:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5735/15526 [1:46:18<3:01:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5735/15526 [1:46:18<3:01:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5736/15526 [1:46:18<3:01:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5736/15526 [1:46:18<3:01:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5737/15526 [1:46:19<3:01:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5737/15526 [1:46:19<3:01:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5738/15526 [1:46:20<3:01:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5738/15526 [1:46:20<3:01:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5739/15526 [1:46:21<3:01:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5739/15526 [1:46:21<3:01:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5740/15526 [1:46:22<3:01:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5740/15526 [1:46:22<3:01:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5741/15526 [1:46:22<3:01:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5741/15526 [1:46:22<3:01:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5742/15526 [1:46:23<3:01:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5742/15526 [1:46:23<3:01:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5743/15526 [1:46:24<3:01:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5743/15526 [1:46:24<3:01:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5744/15526 [1:46:25<3:01:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5744/15526 [1:46:25<3:01:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5745/15526 [1:46:25<3:01:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5745/15526 [1:46:25<3:01:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5746/15526 [1:46:27<3:01:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5746/15526 [1:46:27<3:01:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5747/15526 [1:46:27<3:01:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5747/15526 [1:46:27<3:01:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5748/15526 [1:46:28<3:01:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5748/15526 [1:46:28<3:01:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5749/15526 [1:46:29<3:01:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5749/15526 [1:46:29<3:01:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5750/15526 [1:46:29<3:01:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5750/15526 [1:46:29<3:01:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5751/15526 [1:46:30<3:01:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5751/15526 [1:46:30<3:01:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5752/15526 [1:46:31<3:01:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5752/15526 [1:46:31<3:01:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5753/15526 [1:46:31<3:00:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5753/15526 [1:46:31<3:00:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5754/15526 [1:46:32<3:00:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5754/15526 [1:46:32<3:00:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5755/15526 [1:46:33<3:00:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5755/15526 [1:46:33<3:00:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5756/15526 [1:46:33<3:00:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5756/15526 [1:46:33<3:00:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5757/15526 [1:46:35<3:00:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5757/15526 [1:46:35<3:00:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5758/15526 [1:46:35<3:00:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5758/15526 [1:46:35<3:00:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5759/15526 [1:46:36<3:00:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5759/15526 [1:46:36<3:00:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5760/15526 [1:46:46<3:01:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5760/15526 [1:46:46<3:01:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5761/15526 [1:46:47<3:01:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5761/15526 [1:46:47<3:01:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5762/15526 [1:46:48<3:01:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5762/15526 [1:46:48<3:01:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5763/15526 [1:46:49<3:00:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5763/15526 [1:46:49<3:00:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5764/15526 [1:46:50<3:00:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5764/15526 [1:46:50<3:00:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5765/15526 [1:46:50<3:00:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5765/15526 [1:46:50<3:00:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5766/15526 [1:46:51<3:00:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5766/15526 [1:46:51<3:00:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5767/15526 [1:46:52<3:00:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5767/15526 [1:46:52<3:00:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5768/15526 [1:46:52<3:00:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5768/15526 [1:46:52<3:00:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5769/15526 [1:46:53<3:00:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5769/15526 [1:46:53<3:00:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5770/15526 [1:46:54<3:00:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5770/15526 [1:46:54<3:00:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5771/15526 [1:46:55<3:00:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5771/15526 [1:46:55<3:00:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5772/15526 [1:46:56<3:00:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5772/15526 [1:46:56<3:00:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5773/15526 [1:46:57<3:00:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5773/15526 [1:46:57<3:00:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5774/15526 [1:46:57<3:00:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5774/15526 [1:46:57<3:00:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5775/15526 [1:46:58<3:00:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5775/15526 [1:46:58<3:00:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5776/15526 [1:46:59<3:00:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5776/15526 [1:46:59<3:00:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5777/15526 [1:46:59<3:00:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5777/15526 [1:46:59<3:00:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5778/15526 [1:47:00<3:00:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5778/15526 [1:47:00<3:00:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5779/15526 [1:47:01<3:00:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5779/15526 [1:47:01<3:00:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5780/15526 [1:47:01<3:00:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5780/15526 [1:47:01<3:00:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5781/15526 [1:47:03<3:00:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5781/15526 [1:47:03<3:00:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5782/15526 [1:47:04<3:00:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5782/15526 [1:47:04<3:00:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5783/15526 [1:47:05<3:00:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5783/15526 [1:47:05<3:00:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5784/15526 [1:47:06<3:00:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5784/15526 [1:47:06<3:00:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5785/15526 [1:47:07<3:00:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5785/15526 [1:47:07<3:00:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5786/15526 [1:47:07<3:00:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5786/15526 [1:47:07<3:00:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5787/15526 [1:47:08<3:00:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5787/15526 [1:47:08<3:00:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5788/15526 [1:47:09<3:00:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5788/15526 [1:47:09<3:00:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5789/15526 [1:47:10<3:00:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5789/15526 [1:47:10<3:00:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5790/15526 [1:47:11<3:00:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5790/15526 [1:47:11<3:00:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5791/15526 [1:47:11<3:00:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5791/15526 [1:47:11<3:00:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5792/15526 [1:47:20<3:00:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5792/15526 [1:47:20<3:00:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5793/15526 [1:47:21<3:00:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5793/15526 [1:47:21<3:00:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5794/15526 [1:47:22<3:00:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5794/15526 [1:47:22<3:00:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5795/15526 [1:47:23<3:00:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5795/15526 [1:47:23<3:00:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5796/15526 [1:47:24<3:00:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5796/15526 [1:47:24<3:00:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5797/15526 [1:47:25<3:00:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5797/15526 [1:47:25<3:00:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5798/15526 [1:47:26<3:00:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5798/15526 [1:47:26<3:00:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5799/15526 [1:47:27<3:00:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5799/15526 [1:47:27<3:00:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5800/15526 [1:47:27<3:00:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5800/15526 [1:47:27<3:00:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5801/15526 [1:47:28<3:00:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5801/15526 [1:47:28<3:00:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5802/15526 [1:47:29<3:00:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5802/15526 [1:47:29<3:00:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5803/15526 [1:47:29<3:00:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5803/15526 [1:47:29<3:00:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5804/15526 [1:47:31<3:00:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5804/15526 [1:47:31<3:00:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5805/15526 [1:47:31<3:00:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5805/15526 [1:47:31<3:00:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5806/15526 [1:47:32<3:00:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5806/15526 [1:47:32<3:00:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5807/15526 [1:47:33<3:00:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5807/15526 [1:47:33<3:00:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5808/15526 [1:47:34<2:59:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5808/15526 [1:47:34<2:59:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5809/15526 [1:47:34<2:59:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5809/15526 [1:47:34<2:59:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5810/15526 [1:47:36<2:59:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5810/15526 [1:47:36<2:59:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5811/15526 [1:47:37<2:59:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5811/15526 [1:47:37<2:59:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5812/15526 [1:47:37<2:59:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5812/15526 [1:47:37<2:59:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5813/15526 [1:47:39<2:59:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5813/15526 [1:47:39<2:59:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5814/15526 [1:47:39<2:59:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5814/15526 [1:47:39<2:59:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5815/15526 [1:47:40<2:59:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5815/15526 [1:47:40<2:59:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5816/15526 [1:47:41<2:59:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5816/15526 [1:47:41<2:59:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5817/15526 [1:47:41<2:59:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5817/15526 [1:47:41<2:59:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5818/15526 [1:47:42<2:59:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5818/15526 [1:47:42<2:59:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5819/15526 [1:47:43<2:59:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5819/15526 [1:47:43<2:59:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5820/15526 [1:47:44<2:59:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5820/15526 [1:47:44<2:59:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5821/15526 [1:47:45<2:59:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5821/15526 [1:47:45<2:59:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 5822/15526 [1:47:45<2:59:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  37%|▎| 5822/15526 [1:47:45<2:59:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5823/15526 [1:47:46<2:59:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5823/15526 [1:47:46<2:59:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5824/15526 [1:47:54<2:59:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5824/15526 [1:47:54<2:59:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5825/15526 [1:47:55<2:59:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5825/15526 [1:47:55<2:59:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5826/15526 [1:47:56<2:59:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5826/15526 [1:47:56<2:59:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5827/15526 [1:47:57<2:59:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5827/15526 [1:47:57<2:59:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5828/15526 [1:47:58<2:59:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5828/15526 [1:47:58<2:59:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5829/15526 [1:47:58<2:59:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5829/15526 [1:47:58<2:59:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5830/15526 [1:47:59<2:59:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5830/15526 [1:47:59<2:59:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5831/15526 [1:48:00<2:59:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5831/15526 [1:48:00<2:59:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5832/15526 [1:48:01<2:59:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5832/15526 [1:48:01<2:59:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5833/15526 [1:48:01<2:59:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5833/15526 [1:48:01<2:59:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5834/15526 [1:48:03<2:59:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5834/15526 [1:48:03<2:59:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5835/15526 [1:48:04<2:59:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5835/15526 [1:48:04<2:59:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5836/15526 [1:48:05<2:59:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5836/15526 [1:48:05<2:59:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5837/15526 [1:48:06<2:59:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5837/15526 [1:48:06<2:59:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5838/15526 [1:48:07<2:59:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5838/15526 [1:48:07<2:59:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5839/15526 [1:48:08<2:59:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5839/15526 [1:48:08<2:59:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5840/15526 [1:48:09<2:59:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5840/15526 [1:48:09<2:59:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5841/15526 [1:48:09<2:59:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5841/15526 [1:48:09<2:59:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5842/15526 [1:48:10<2:59:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5842/15526 [1:48:10<2:59:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5843/15526 [1:48:11<2:59:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5843/15526 [1:48:11<2:59:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5844/15526 [1:48:11<2:59:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5844/15526 [1:48:11<2:59:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5845/15526 [1:48:12<2:59:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5845/15526 [1:48:12<2:59:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5846/15526 [1:48:13<2:59:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5846/15526 [1:48:13<2:59:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5847/15526 [1:48:14<2:59:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5847/15526 [1:48:14<2:59:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5848/15526 [1:48:15<2:59:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5848/15526 [1:48:15<2:59:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5849/15526 [1:48:15<2:59:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5849/15526 [1:48:15<2:59:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5850/15526 [1:48:16<2:59:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5850/15526 [1:48:16<2:59:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5851/15526 [1:48:17<2:59:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5851/15526 [1:48:17<2:59:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5852/15526 [1:48:18<2:59:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5852/15526 [1:48:18<2:59:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5853/15526 [1:48:18<2:59:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5853/15526 [1:48:18<2:59:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5854/15526 [1:48:20<2:58:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5854/15526 [1:48:20<2:58:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5855/15526 [1:48:20<2:58:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5855/15526 [1:48:20<2:58:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5856/15526 [1:48:30<2:59:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5856/15526 [1:48:30<2:59:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5857/15526 [1:48:31<2:59:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5857/15526 [1:48:31<2:59:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5858/15526 [1:48:32<2:59:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5858/15526 [1:48:32<2:59:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5859/15526 [1:48:33<2:59:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5859/15526 [1:48:33<2:59:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5860/15526 [1:48:34<2:59:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5860/15526 [1:48:34<2:59:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5861/15526 [1:48:35<2:59:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5861/15526 [1:48:35<2:59:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5862/15526 [1:48:36<2:59:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5862/15526 [1:48:36<2:59:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5863/15526 [1:48:37<2:59:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5863/15526 [1:48:37<2:59:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5864/15526 [1:48:38<2:58:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5864/15526 [1:48:38<2:58:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5865/15526 [1:48:38<2:58:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5865/15526 [1:48:38<2:58:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5866/15526 [1:48:39<2:58:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5866/15526 [1:48:39<2:58:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5867/15526 [1:48:40<2:58:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5867/15526 [1:48:40<2:58:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5868/15526 [1:48:41<2:58:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5868/15526 [1:48:41<2:58:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5869/15526 [1:48:42<2:58:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5869/15526 [1:48:42<2:58:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5870/15526 [1:48:43<2:58:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5870/15526 [1:48:43<2:58:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5871/15526 [1:48:44<2:58:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5871/15526 [1:48:44<2:58:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5872/15526 [1:48:44<2:58:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5872/15526 [1:48:44<2:58:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5873/15526 [1:48:45<2:58:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5873/15526 [1:48:45<2:58:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5874/15526 [1:48:46<2:58:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5874/15526 [1:48:46<2:58:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5875/15526 [1:48:46<2:58:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5875/15526 [1:48:46<2:58:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5876/15526 [1:48:48<2:58:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5876/15526 [1:48:48<2:58:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5877/15526 [1:48:48<2:58:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5877/15526 [1:48:48<2:58:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5878/15526 [1:48:49<2:58:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5878/15526 [1:48:49<2:58:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5879/15526 [1:48:50<2:58:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5879/15526 [1:48:50<2:58:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5880/15526 [1:48:51<2:58:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5880/15526 [1:48:51<2:58:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5881/15526 [1:48:52<2:58:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5881/15526 [1:48:52<2:58:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5882/15526 [1:48:53<2:58:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5882/15526 [1:48:53<2:58:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5883/15526 [1:48:53<2:58:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5883/15526 [1:48:53<2:58:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5884/15526 [1:48:54<2:58:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5884/15526 [1:48:54<2:58:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5885/15526 [1:48:55<2:58:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5885/15526 [1:48:55<2:58:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5886/15526 [1:48:56<2:58:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5886/15526 [1:48:56<2:58:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5887/15526 [1:48:57<2:58:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5887/15526 [1:48:57<2:58:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5888/15526 [1:49:03<2:58:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5888/15526 [1:49:03<2:58:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5889/15526 [1:49:04<2:58:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5889/15526 [1:49:04<2:58:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5890/15526 [1:49:05<2:58:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5890/15526 [1:49:05<2:58:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5891/15526 [1:49:06<2:58:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5891/15526 [1:49:06<2:58:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5892/15526 [1:49:06<2:58:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5892/15526 [1:49:06<2:58:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5893/15526 [1:49:07<2:58:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5893/15526 [1:49:07<2:58:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5894/15526 [1:49:08<2:58:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5894/15526 [1:49:08<2:58:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5895/15526 [1:49:09<2:58:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5895/15526 [1:49:09<2:58:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5896/15526 [1:49:10<2:58:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5896/15526 [1:49:10<2:58:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5897/15526 [1:49:11<2:58:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5897/15526 [1:49:11<2:58:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5898/15526 [1:49:12<2:58:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5898/15526 [1:49:12<2:58:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5899/15526 [1:49:12<2:58:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5899/15526 [1:49:12<2:58:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5900/15526 [1:49:13<2:58:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5900/15526 [1:49:13<2:58:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5901/15526 [1:49:14<2:58:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5901/15526 [1:49:14<2:58:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5902/15526 [1:49:15<2:58:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5902/15526 [1:49:15<2:58:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5903/15526 [1:49:16<2:58:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5903/15526 [1:49:16<2:58:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5904/15526 [1:49:17<2:58:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5904/15526 [1:49:17<2:58:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5905/15526 [1:49:17<2:58:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5905/15526 [1:49:17<2:58:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5906/15526 [1:49:18<2:58:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5906/15526 [1:49:18<2:58:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5907/15526 [1:49:19<2:58:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5907/15526 [1:49:19<2:58:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5908/15526 [1:49:19<2:57:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5908/15526 [1:49:19<2:57:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5909/15526 [1:49:20<2:57:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5909/15526 [1:49:20<2:57:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5910/15526 [1:49:21<2:57:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5910/15526 [1:49:21<2:57:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5911/15526 [1:49:22<2:57:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5911/15526 [1:49:22<2:57:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5912/15526 [1:49:23<2:57:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5912/15526 [1:49:23<2:57:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5913/15526 [1:49:24<2:57:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5913/15526 [1:49:24<2:57:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5914/15526 [1:49:24<2:57:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5914/15526 [1:49:24<2:57:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5915/15526 [1:49:25<2:57:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5915/15526 [1:49:25<2:57:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5916/15526 [1:49:26<2:57:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5916/15526 [1:49:26<2:57:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5917/15526 [1:49:27<2:57:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5917/15526 [1:49:27<2:57:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5918/15526 [1:49:27<2:57:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5918/15526 [1:49:27<2:57:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5919/15526 [1:49:29<2:57:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5919/15526 [1:49:29<2:57:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5920/15526 [1:49:37<2:57:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5920/15526 [1:49:37<2:57:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5921/15526 [1:49:38<2:57:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5921/15526 [1:49:38<2:57:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5922/15526 [1:49:38<2:57:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5922/15526 [1:49:38<2:57:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5923/15526 [1:49:39<2:57:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5923/15526 [1:49:39<2:57:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5924/15526 [1:49:40<2:57:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5924/15526 [1:49:40<2:57:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5925/15526 [1:49:41<2:57:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5925/15526 [1:49:41<2:57:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5926/15526 [1:49:41<2:57:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5926/15526 [1:49:41<2:57:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5927/15526 [1:49:43<2:57:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5927/15526 [1:49:43<2:57:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5928/15526 [1:49:44<2:57:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5928/15526 [1:49:44<2:57:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5929/15526 [1:49:44<2:57:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5929/15526 [1:49:44<2:57:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5930/15526 [1:49:45<2:57:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5930/15526 [1:49:45<2:57:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5931/15526 [1:49:46<2:57:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5931/15526 [1:49:46<2:57:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5932/15526 [1:49:47<2:57:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5932/15526 [1:49:47<2:57:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5933/15526 [1:49:48<2:57:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5933/15526 [1:49:48<2:57:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5934/15526 [1:49:48<2:57:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5934/15526 [1:49:48<2:57:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5935/15526 [1:49:49<2:57:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5935/15526 [1:49:49<2:57:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5936/15526 [1:49:49<2:57:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5936/15526 [1:49:49<2:57:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5937/15526 [1:49:51<2:57:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5937/15526 [1:49:51<2:57:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5938/15526 [1:49:52<2:57:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5938/15526 [1:49:52<2:57:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5939/15526 [1:49:52<2:57:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5939/15526 [1:49:52<2:57:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5940/15526 [1:49:54<2:57:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5940/15526 [1:49:54<2:57:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5941/15526 [1:49:55<2:57:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5941/15526 [1:49:55<2:57:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5942/15526 [1:49:55<2:57:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5942/15526 [1:49:55<2:57:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5943/15526 [1:49:56<2:57:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5943/15526 [1:49:56<2:57:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5944/15526 [1:49:57<2:57:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5944/15526 [1:49:57<2:57:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5945/15526 [1:49:58<2:57:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5945/15526 [1:49:58<2:57:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5946/15526 [1:49:59<2:57:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5946/15526 [1:49:59<2:57:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5947/15526 [1:49:59<2:57:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5947/15526 [1:49:59<2:57:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5948/15526 [1:50:00<2:57:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5948/15526 [1:50:00<2:57:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5949/15526 [1:50:01<2:57:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5949/15526 [1:50:01<2:57:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5950/15526 [1:50:02<2:57:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5950/15526 [1:50:02<2:57:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5951/15526 [1:50:02<2:57:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5951/15526 [1:50:02<2:57:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5952/15526 [1:50:12<2:57:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5952/15526 [1:50:12<2:57:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5953/15526 [1:50:13<2:57:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5953/15526 [1:50:13<2:57:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5954/15526 [1:50:13<2:57:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5954/15526 [1:50:13<2:57:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5955/15526 [1:50:14<2:57:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5955/15526 [1:50:14<2:57:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5956/15526 [1:50:15<2:57:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5956/15526 [1:50:15<2:57:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5957/15526 [1:50:16<2:57:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5957/15526 [1:50:16<2:57:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5958/15526 [1:50:16<2:57:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5958/15526 [1:50:16<2:57:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5959/15526 [1:50:18<2:57:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5959/15526 [1:50:18<2:57:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5960/15526 [1:50:19<2:57:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5960/15526 [1:50:19<2:57:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5961/15526 [1:50:20<2:57:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5961/15526 [1:50:20<2:57:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5962/15526 [1:50:21<2:57:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5962/15526 [1:50:21<2:57:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5963/15526 [1:50:21<2:56:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5963/15526 [1:50:21<2:56:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5964/15526 [1:50:22<2:56:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5964/15526 [1:50:22<2:56:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5965/15526 [1:50:24<2:56:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5965/15526 [1:50:24<2:56:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5966/15526 [1:50:25<2:56:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5966/15526 [1:50:25<2:56:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5967/15526 [1:50:26<2:56:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5967/15526 [1:50:26<2:56:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5968/15526 [1:50:27<2:56:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5968/15526 [1:50:27<2:56:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5969/15526 [1:50:28<2:56:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5969/15526 [1:50:28<2:56:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5970/15526 [1:50:29<2:56:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5970/15526 [1:50:29<2:56:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5971/15526 [1:50:30<2:56:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5971/15526 [1:50:30<2:56:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5972/15526 [1:50:30<2:56:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5972/15526 [1:50:30<2:56:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5973/15526 [1:50:31<2:56:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5973/15526 [1:50:31<2:56:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5974/15526 [1:50:32<2:56:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5974/15526 [1:50:32<2:56:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5975/15526 [1:50:33<2:56:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5975/15526 [1:50:33<2:56:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5976/15526 [1:50:34<2:56:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5976/15526 [1:50:34<2:56:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 5977/15526 [1:50:35<2:56:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  38%|▍| 5977/15526 [1:50:35<2:56:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5978/15526 [1:50:36<2:56:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5978/15526 [1:50:36<2:56:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5979/15526 [1:50:37<2:56:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5979/15526 [1:50:37<2:56:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5980/15526 [1:50:37<2:56:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5980/15526 [1:50:37<2:56:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5981/15526 [1:50:38<2:56:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5981/15526 [1:50:38<2:56:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5982/15526 [1:50:39<2:56:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5982/15526 [1:50:39<2:56:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5983/15526 [1:50:39<2:56:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5983/15526 [1:50:39<2:56:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5984/15526 [1:50:48<2:56:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5984/15526 [1:50:48<2:56:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5985/15526 [1:50:48<2:56:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5985/15526 [1:50:48<2:56:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5986/15526 [1:50:50<2:56:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5986/15526 [1:50:50<2:56:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5987/15526 [1:50:51<2:56:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5987/15526 [1:50:51<2:56:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5988/15526 [1:50:51<2:56:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5988/15526 [1:50:51<2:56:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5989/15526 [1:50:53<2:56:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5989/15526 [1:50:53<2:56:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5990/15526 [1:50:53<2:56:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5990/15526 [1:50:53<2:56:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5991/15526 [1:50:54<2:56:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5991/15526 [1:50:54<2:56:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5992/15526 [1:50:55<2:56:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5992/15526 [1:50:55<2:56:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5993/15526 [1:50:56<2:56:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5993/15526 [1:50:56<2:56:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5994/15526 [1:50:57<2:56:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5994/15526 [1:50:57<2:56:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5995/15526 [1:50:58<2:56:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5995/15526 [1:50:58<2:56:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5996/15526 [1:50:59<2:56:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5996/15526 [1:50:59<2:56:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5997/15526 [1:51:00<2:56:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5997/15526 [1:51:00<2:56:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5998/15526 [1:51:01<2:56:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5998/15526 [1:51:01<2:56:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 5999/15526 [1:51:01<2:56:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 5999/15526 [1:51:01<2:56:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6000/15526 [1:51:02<2:56:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6000/15526 [1:51:02<2:56:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6001/15526 [1:51:03<2:56:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6001/15526 [1:51:03<2:56:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6002/15526 [1:51:03<2:56:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6002/15526 [1:51:03<2:56:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6003/15526 [1:51:04<2:56:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6003/15526 [1:51:04<2:56:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6004/15526 [1:51:06<2:56:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6004/15526 [1:51:06<2:56:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6005/15526 [1:51:06<2:56:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6005/15526 [1:51:06<2:56:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6006/15526 [1:51:07<2:56:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6006/15526 [1:51:07<2:56:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6007/15526 [1:51:08<2:56:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6007/15526 [1:51:08<2:56:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6008/15526 [1:51:08<2:56:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6008/15526 [1:51:08<2:56:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6009/15526 [1:51:09<2:56:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6009/15526 [1:51:09<2:56:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6010/15526 [1:51:10<2:56:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6010/15526 [1:51:10<2:56:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6011/15526 [1:51:10<2:55:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6011/15526 [1:51:10<2:55:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6012/15526 [1:51:11<2:55:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6012/15526 [1:51:11<2:55:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6013/15526 [1:51:12<2:55:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6013/15526 [1:51:12<2:55:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6014/15526 [1:51:13<2:55:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6014/15526 [1:51:13<2:55:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6015/15526 [1:51:14<2:55:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6015/15526 [1:51:14<2:55:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6016/15526 [1:51:25<2:56:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6016/15526 [1:51:25<2:56:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6017/15526 [1:51:26<2:56:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6017/15526 [1:51:26<2:56:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6018/15526 [1:51:27<2:56:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6018/15526 [1:51:27<2:56:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6019/15526 [1:51:28<2:56:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6019/15526 [1:51:28<2:56:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6020/15526 [1:51:29<2:56:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6020/15526 [1:51:29<2:56:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6021/15526 [1:51:30<2:56:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6021/15526 [1:51:30<2:56:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6022/15526 [1:51:31<2:55:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6022/15526 [1:51:31<2:55:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6023/15526 [1:51:32<2:55:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6023/15526 [1:51:32<2:55:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6024/15526 [1:51:32<2:55:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6024/15526 [1:51:32<2:55:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6025/15526 [1:51:33<2:55:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6025/15526 [1:51:33<2:55:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6026/15526 [1:51:34<2:55:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6026/15526 [1:51:34<2:55:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6027/15526 [1:51:35<2:55:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6027/15526 [1:51:35<2:55:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6028/15526 [1:51:36<2:55:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6028/15526 [1:51:36<2:55:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6029/15526 [1:51:37<2:55:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6029/15526 [1:51:37<2:55:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6030/15526 [1:51:37<2:55:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6030/15526 [1:51:37<2:55:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6031/15526 [1:51:38<2:55:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6031/15526 [1:51:38<2:55:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6032/15526 [1:51:39<2:55:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6032/15526 [1:51:39<2:55:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6033/15526 [1:51:39<2:55:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6033/15526 [1:51:39<2:55:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6034/15526 [1:51:41<2:55:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6034/15526 [1:51:41<2:55:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6035/15526 [1:51:42<2:55:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6035/15526 [1:51:42<2:55:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6036/15526 [1:51:42<2:55:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6036/15526 [1:51:42<2:55:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6037/15526 [1:51:44<2:55:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6037/15526 [1:51:44<2:55:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6038/15526 [1:51:45<2:55:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6038/15526 [1:51:45<2:55:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6039/15526 [1:51:46<2:55:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6039/15526 [1:51:46<2:55:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6040/15526 [1:51:47<2:55:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6040/15526 [1:51:47<2:55:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6041/15526 [1:51:48<2:55:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6041/15526 [1:51:48<2:55:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6042/15526 [1:51:49<2:55:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6042/15526 [1:51:49<2:55:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6043/15526 [1:51:50<2:55:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6043/15526 [1:51:50<2:55:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6044/15526 [1:51:50<2:55:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6044/15526 [1:51:50<2:55:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6045/15526 [1:51:51<2:55:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6045/15526 [1:51:51<2:55:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6046/15526 [1:51:52<2:55:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6046/15526 [1:51:52<2:55:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6047/15526 [1:51:52<2:55:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6047/15526 [1:51:52<2:55:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6048/15526 [1:51:59<2:55:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6048/15526 [1:51:59<2:55:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6049/15526 [1:51:59<2:55:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6049/15526 [1:51:59<2:55:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6050/15526 [1:52:00<2:55:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6050/15526 [1:52:00<2:55:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6051/15526 [1:52:00<2:55:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6051/15526 [1:52:00<2:55:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6052/15526 [1:52:01<2:55:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6052/15526 [1:52:01<2:55:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6053/15526 [1:52:02<2:55:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6053/15526 [1:52:02<2:55:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6054/15526 [1:52:02<2:55:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6054/15526 [1:52:02<2:55:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6055/15526 [1:52:04<2:55:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6055/15526 [1:52:04<2:55:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6056/15526 [1:52:04<2:55:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6056/15526 [1:52:04<2:55:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6057/15526 [1:52:05<2:55:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6057/15526 [1:52:05<2:55:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6058/15526 [1:52:07<2:55:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6058/15526 [1:52:07<2:55:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6059/15526 [1:52:08<2:55:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6059/15526 [1:52:08<2:55:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6060/15526 [1:52:08<2:55:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6060/15526 [1:52:08<2:55:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6061/15526 [1:52:09<2:55:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6061/15526 [1:52:09<2:55:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6062/15526 [1:52:10<2:55:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6062/15526 [1:52:10<2:55:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6063/15526 [1:52:11<2:55:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6063/15526 [1:52:11<2:55:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6064/15526 [1:52:12<2:55:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6064/15526 [1:52:12<2:55:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6065/15526 [1:52:13<2:55:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6065/15526 [1:52:13<2:55:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6066/15526 [1:52:14<2:55:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6066/15526 [1:52:14<2:55:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6067/15526 [1:52:15<2:55:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6067/15526 [1:52:15<2:55:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6068/15526 [1:52:15<2:54:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6068/15526 [1:52:15<2:54:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6069/15526 [1:52:16<2:54:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6069/15526 [1:52:16<2:54:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6070/15526 [1:52:17<2:54:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6070/15526 [1:52:17<2:54:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6071/15526 [1:52:18<2:54:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6071/15526 [1:52:18<2:54:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6072/15526 [1:52:19<2:54:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6072/15526 [1:52:19<2:54:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6073/15526 [1:52:20<2:54:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6073/15526 [1:52:20<2:54:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6074/15526 [1:52:21<2:54:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6074/15526 [1:52:21<2:54:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6075/15526 [1:52:22<2:54:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6075/15526 [1:52:22<2:54:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6076/15526 [1:52:23<2:54:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6076/15526 [1:52:23<2:54:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6077/15526 [1:52:23<2:54:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6077/15526 [1:52:23<2:54:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6078/15526 [1:52:24<2:54:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6078/15526 [1:52:24<2:54:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6079/15526 [1:52:25<2:54:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6079/15526 [1:52:25<2:54:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6080/15526 [1:52:34<2:54:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6080/15526 [1:52:34<2:54:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6081/15526 [1:52:35<2:54:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6081/15526 [1:52:35<2:54:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6082/15526 [1:52:35<2:54:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6082/15526 [1:52:35<2:54:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6083/15526 [1:52:36<2:54:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6083/15526 [1:52:36<2:54:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6084/15526 [1:52:37<2:54:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6084/15526 [1:52:37<2:54:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6085/15526 [1:52:38<2:54:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6085/15526 [1:52:38<2:54:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6086/15526 [1:52:39<2:54:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6086/15526 [1:52:39<2:54:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6087/15526 [1:52:40<2:54:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6087/15526 [1:52:40<2:54:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6088/15526 [1:52:41<2:54:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6088/15526 [1:52:41<2:54:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6089/15526 [1:52:42<2:54:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6089/15526 [1:52:42<2:54:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6090/15526 [1:52:43<2:54:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6090/15526 [1:52:43<2:54:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6091/15526 [1:52:44<2:54:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6091/15526 [1:52:44<2:54:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6092/15526 [1:52:45<2:54:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6092/15526 [1:52:45<2:54:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6093/15526 [1:52:46<2:54:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6093/15526 [1:52:46<2:54:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6094/15526 [1:52:47<2:54:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6094/15526 [1:52:47<2:54:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6095/15526 [1:52:47<2:54:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6095/15526 [1:52:47<2:54:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6096/15526 [1:52:48<2:54:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6096/15526 [1:52:48<2:54:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6097/15526 [1:52:49<2:54:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6097/15526 [1:52:49<2:54:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6098/15526 [1:52:50<2:54:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6098/15526 [1:52:50<2:54:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6099/15526 [1:52:51<2:54:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6099/15526 [1:52:51<2:54:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6100/15526 [1:52:51<2:54:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6100/15526 [1:52:51<2:54:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6101/15526 [1:52:52<2:54:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6101/15526 [1:52:52<2:54:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6102/15526 [1:52:53<2:54:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6102/15526 [1:52:53<2:54:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6103/15526 [1:52:54<2:54:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6103/15526 [1:52:54<2:54:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6104/15526 [1:52:55<2:54:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6104/15526 [1:52:55<2:54:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6105/15526 [1:52:56<2:54:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6105/15526 [1:52:56<2:54:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6106/15526 [1:52:56<2:54:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6106/15526 [1:52:56<2:54:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6107/15526 [1:52:57<2:54:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6107/15526 [1:52:57<2:54:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6108/15526 [1:52:58<2:54:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6108/15526 [1:52:58<2:54:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6109/15526 [1:52:59<2:54:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6109/15526 [1:52:59<2:54:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6110/15526 [1:53:00<2:54:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6110/15526 [1:53:00<2:54:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6111/15526 [1:53:00<2:54:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6111/15526 [1:53:00<2:54:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6112/15526 [1:53:09<2:54:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6112/15526 [1:53:09<2:54:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6113/15526 [1:53:09<2:54:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6113/15526 [1:53:09<2:54:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6114/15526 [1:53:10<2:54:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6114/15526 [1:53:10<2:54:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6115/15526 [1:53:11<2:54:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6115/15526 [1:53:11<2:54:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6116/15526 [1:53:11<2:54:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6116/15526 [1:53:11<2:54:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6117/15526 [1:53:12<2:54:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6117/15526 [1:53:12<2:54:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6118/15526 [1:53:13<2:54:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6118/15526 [1:53:13<2:54:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6119/15526 [1:53:13<2:54:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6119/15526 [1:53:13<2:54:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6120/15526 [1:53:14<2:54:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6120/15526 [1:53:14<2:54:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6121/15526 [1:53:15<2:54:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6121/15526 [1:53:15<2:54:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6122/15526 [1:53:15<2:53:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6122/15526 [1:53:15<2:53:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6123/15526 [1:53:16<2:53:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6123/15526 [1:53:16<2:53:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6124/15526 [1:53:17<2:53:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6124/15526 [1:53:17<2:53:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6125/15526 [1:53:17<2:53:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6125/15526 [1:53:17<2:53:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6126/15526 [1:53:18<2:53:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6126/15526 [1:53:18<2:53:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6127/15526 [1:53:19<2:53:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6127/15526 [1:53:19<2:53:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6128/15526 [1:53:20<2:53:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6128/15526 [1:53:20<2:53:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6129/15526 [1:53:21<2:53:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6129/15526 [1:53:21<2:53:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6130/15526 [1:53:22<2:53:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6130/15526 [1:53:22<2:53:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6131/15526 [1:53:23<2:53:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6131/15526 [1:53:23<2:53:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 6132/15526 [1:53:23<2:53:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  39%|▍| 6132/15526 [1:53:23<2:53:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6133/15526 [1:53:25<2:53:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6133/15526 [1:53:25<2:53:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6134/15526 [1:53:26<2:53:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6134/15526 [1:53:26<2:53:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6135/15526 [1:53:27<2:53:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6135/15526 [1:53:27<2:53:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6136/15526 [1:53:28<2:53:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6136/15526 [1:53:28<2:53:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6137/15526 [1:53:28<2:53:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6137/15526 [1:53:28<2:53:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6138/15526 [1:53:29<2:53:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6138/15526 [1:53:29<2:53:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6139/15526 [1:53:30<2:53:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6139/15526 [1:53:30<2:53:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6140/15526 [1:53:31<2:53:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6140/15526 [1:53:31<2:53:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6141/15526 [1:53:32<2:53:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6141/15526 [1:53:32<2:53:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6142/15526 [1:53:33<2:53:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6142/15526 [1:53:33<2:53:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6143/15526 [1:53:34<2:53:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6143/15526 [1:53:34<2:53:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6144/15526 [1:53:44<2:53:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6144/15526 [1:53:44<2:53:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6145/15526 [1:53:45<2:53:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6145/15526 [1:53:45<2:53:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6146/15526 [1:53:46<2:53:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6146/15526 [1:53:46<2:53:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6147/15526 [1:53:47<2:53:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6147/15526 [1:53:47<2:53:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6148/15526 [1:53:48<2:53:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6148/15526 [1:53:48<2:53:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6149/15526 [1:53:48<2:53:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6149/15526 [1:53:48<2:53:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6150/15526 [1:53:49<2:53:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6150/15526 [1:53:49<2:53:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6151/15526 [1:53:50<2:53:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6151/15526 [1:53:50<2:53:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6152/15526 [1:53:50<2:53:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6152/15526 [1:53:50<2:53:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6153/15526 [1:53:51<2:53:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6153/15526 [1:53:51<2:53:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6154/15526 [1:53:52<2:53:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6154/15526 [1:53:52<2:53:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6155/15526 [1:53:52<2:53:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6155/15526 [1:53:52<2:53:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6156/15526 [1:53:53<2:53:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6156/15526 [1:53:53<2:53:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6157/15526 [1:53:54<2:53:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6157/15526 [1:53:54<2:53:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6158/15526 [1:53:55<2:53:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6158/15526 [1:53:55<2:53:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6159/15526 [1:53:57<2:53:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6159/15526 [1:53:57<2:53:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6160/15526 [1:53:58<2:53:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6160/15526 [1:53:58<2:53:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6161/15526 [1:53:58<2:53:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6161/15526 [1:53:58<2:53:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6162/15526 [1:54:00<2:53:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6162/15526 [1:54:00<2:53:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6163/15526 [1:54:01<2:53:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6163/15526 [1:54:01<2:53:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6164/15526 [1:54:02<2:53:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6164/15526 [1:54:02<2:53:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6165/15526 [1:54:03<2:53:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6165/15526 [1:54:03<2:53:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6166/15526 [1:54:03<2:53:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6166/15526 [1:54:03<2:53:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6167/15526 [1:54:05<2:53:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6167/15526 [1:54:05<2:53:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6168/15526 [1:54:05<2:53:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6168/15526 [1:54:05<2:53:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6169/15526 [1:54:06<2:53:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6169/15526 [1:54:06<2:53:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6170/15526 [1:54:07<2:53:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6170/15526 [1:54:07<2:53:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6171/15526 [1:54:07<2:53:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6171/15526 [1:54:07<2:53:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6172/15526 [1:54:08<2:52:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6172/15526 [1:54:08<2:52:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6173/15526 [1:54:09<2:52:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6173/15526 [1:54:09<2:52:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6174/15526 [1:54:10<2:52:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6174/15526 [1:54:10<2:52:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6175/15526 [1:54:11<2:52:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6175/15526 [1:54:11<2:52:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6176/15526 [1:54:17<2:53:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6176/15526 [1:54:17<2:53:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6177/15526 [1:54:18<2:53:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6177/15526 [1:54:18<2:53:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6178/15526 [1:54:19<2:52:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6178/15526 [1:54:19<2:52:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6179/15526 [1:54:20<2:52:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6179/15526 [1:54:20<2:52:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6180/15526 [1:54:21<2:52:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6180/15526 [1:54:21<2:52:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6181/15526 [1:54:22<2:52:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6181/15526 [1:54:22<2:52:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6182/15526 [1:54:22<2:52:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6182/15526 [1:54:22<2:52:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6183/15526 [1:54:24<2:52:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6183/15526 [1:54:24<2:52:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6184/15526 [1:54:24<2:52:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6184/15526 [1:54:24<2:52:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6185/15526 [1:54:25<2:52:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6185/15526 [1:54:25<2:52:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6186/15526 [1:54:26<2:52:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6186/15526 [1:54:26<2:52:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6187/15526 [1:54:27<2:52:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6187/15526 [1:54:27<2:52:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6188/15526 [1:54:28<2:52:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6188/15526 [1:54:28<2:52:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6189/15526 [1:54:29<2:52:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6189/15526 [1:54:29<2:52:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6190/15526 [1:54:30<2:52:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6190/15526 [1:54:30<2:52:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6191/15526 [1:54:31<2:52:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6191/15526 [1:54:31<2:52:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6192/15526 [1:54:32<2:52:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6192/15526 [1:54:32<2:52:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6193/15526 [1:54:33<2:52:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6193/15526 [1:54:33<2:52:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6194/15526 [1:54:35<2:52:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6194/15526 [1:54:35<2:52:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6195/15526 [1:54:35<2:52:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6195/15526 [1:54:35<2:52:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6196/15526 [1:54:36<2:52:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6196/15526 [1:54:36<2:52:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6197/15526 [1:54:37<2:52:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6197/15526 [1:54:37<2:52:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6198/15526 [1:54:37<2:52:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6198/15526 [1:54:37<2:52:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6199/15526 [1:54:38<2:52:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6199/15526 [1:54:38<2:52:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6200/15526 [1:54:39<2:52:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6200/15526 [1:54:39<2:52:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6201/15526 [1:54:40<2:52:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6201/15526 [1:54:40<2:52:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6202/15526 [1:54:41<2:52:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6202/15526 [1:54:41<2:52:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6203/15526 [1:54:42<2:52:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6203/15526 [1:54:42<2:52:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6204/15526 [1:54:43<2:52:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6204/15526 [1:54:43<2:52:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6205/15526 [1:54:44<2:52:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6205/15526 [1:54:44<2:52:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6206/15526 [1:54:45<2:52:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6206/15526 [1:54:45<2:52:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6207/15526 [1:54:46<2:52:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6207/15526 [1:54:46<2:52:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6208/15526 [1:54:52<2:52:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6208/15526 [1:54:52<2:52:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6209/15526 [1:54:53<2:52:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6209/15526 [1:54:53<2:52:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6210/15526 [1:54:54<2:52:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6210/15526 [1:54:54<2:52:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6211/15526 [1:54:55<2:52:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6211/15526 [1:54:55<2:52:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6212/15526 [1:54:57<2:52:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6212/15526 [1:54:57<2:52:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6213/15526 [1:54:57<2:52:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6213/15526 [1:54:57<2:52:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6214/15526 [1:54:58<2:52:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6214/15526 [1:54:58<2:52:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6215/15526 [1:54:59<2:52:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6215/15526 [1:54:59<2:52:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6216/15526 [1:55:00<2:52:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6216/15526 [1:55:00<2:52:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6217/15526 [1:55:00<2:52:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6217/15526 [1:55:00<2:52:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6218/15526 [1:55:01<2:52:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6218/15526 [1:55:01<2:52:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6219/15526 [1:55:02<2:52:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6219/15526 [1:55:02<2:52:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6220/15526 [1:55:02<2:52:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6220/15526 [1:55:02<2:52:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6221/15526 [1:55:04<2:52:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6221/15526 [1:55:04<2:52:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6222/15526 [1:55:05<2:52:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6222/15526 [1:55:05<2:52:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6223/15526 [1:55:06<2:52:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6223/15526 [1:55:06<2:52:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6224/15526 [1:55:07<2:52:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6224/15526 [1:55:07<2:52:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6225/15526 [1:55:07<2:52:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6225/15526 [1:55:07<2:52:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6226/15526 [1:55:09<2:52:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6226/15526 [1:55:09<2:52:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6227/15526 [1:55:10<2:51:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6227/15526 [1:55:10<2:51:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6228/15526 [1:55:10<2:51:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6228/15526 [1:55:10<2:51:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6229/15526 [1:55:12<2:51:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6229/15526 [1:55:12<2:51:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6230/15526 [1:55:12<2:51:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6230/15526 [1:55:12<2:51:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6231/15526 [1:55:13<2:51:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6231/15526 [1:55:13<2:51:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6232/15526 [1:55:14<2:51:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6232/15526 [1:55:14<2:51:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6233/15526 [1:55:14<2:51:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6233/15526 [1:55:14<2:51:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6234/15526 [1:55:15<2:51:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6234/15526 [1:55:15<2:51:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6235/15526 [1:55:16<2:51:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6235/15526 [1:55:16<2:51:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6236/15526 [1:55:16<2:51:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6236/15526 [1:55:16<2:51:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6237/15526 [1:55:17<2:51:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6237/15526 [1:55:17<2:51:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6238/15526 [1:55:18<2:51:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6238/15526 [1:55:18<2:51:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6239/15526 [1:55:18<2:51:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6239/15526 [1:55:18<2:51:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6240/15526 [1:55:26<2:51:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6240/15526 [1:55:26<2:51:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6241/15526 [1:55:27<2:51:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6241/15526 [1:55:27<2:51:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6242/15526 [1:55:27<2:51:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6242/15526 [1:55:27<2:51:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6243/15526 [1:55:29<2:51:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6243/15526 [1:55:29<2:51:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6244/15526 [1:55:29<2:51:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6244/15526 [1:55:29<2:51:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6245/15526 [1:55:30<2:51:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6245/15526 [1:55:30<2:51:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6246/15526 [1:55:31<2:51:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6246/15526 [1:55:31<2:51:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6247/15526 [1:55:31<2:51:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6247/15526 [1:55:31<2:51:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6248/15526 [1:55:32<2:51:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6248/15526 [1:55:32<2:51:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6249/15526 [1:55:33<2:51:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6249/15526 [1:55:33<2:51:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6250/15526 [1:55:34<2:51:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6250/15526 [1:55:34<2:51:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6251/15526 [1:55:35<2:51:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6251/15526 [1:55:35<2:51:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6252/15526 [1:55:36<2:51:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6252/15526 [1:55:36<2:51:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6253/15526 [1:55:36<2:51:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6253/15526 [1:55:36<2:51:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6254/15526 [1:55:37<2:51:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6254/15526 [1:55:37<2:51:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6255/15526 [1:55:38<2:51:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6255/15526 [1:55:38<2:51:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6256/15526 [1:55:39<2:51:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6256/15526 [1:55:39<2:51:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6257/15526 [1:55:40<2:51:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6257/15526 [1:55:40<2:51:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6258/15526 [1:55:41<2:51:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6258/15526 [1:55:41<2:51:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6259/15526 [1:55:42<2:51:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6259/15526 [1:55:42<2:51:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6260/15526 [1:55:42<2:51:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6260/15526 [1:55:42<2:51:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6261/15526 [1:55:43<2:51:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6261/15526 [1:55:43<2:51:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6262/15526 [1:55:44<2:51:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6262/15526 [1:55:44<2:51:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6263/15526 [1:55:45<2:51:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6263/15526 [1:55:45<2:51:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6264/15526 [1:55:46<2:51:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6264/15526 [1:55:46<2:51:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6265/15526 [1:55:46<2:51:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6265/15526 [1:55:46<2:51:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6266/15526 [1:55:47<2:51:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6266/15526 [1:55:47<2:51:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6267/15526 [1:55:48<2:51:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6267/15526 [1:55:48<2:51:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6268/15526 [1:55:49<2:51:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6268/15526 [1:55:49<2:51:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6269/15526 [1:55:51<2:51:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6269/15526 [1:55:51<2:51:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6270/15526 [1:55:51<2:51:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6270/15526 [1:55:51<2:51:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6271/15526 [1:55:52<2:51:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6271/15526 [1:55:52<2:51:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6272/15526 [1:56:03<2:51:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6272/15526 [1:56:03<2:51:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6273/15526 [1:56:04<2:51:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6273/15526 [1:56:04<2:51:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6274/15526 [1:56:04<2:51:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6274/15526 [1:56:04<2:51:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6275/15526 [1:56:05<2:51:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6275/15526 [1:56:05<2:51:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6276/15526 [1:56:06<2:51:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6276/15526 [1:56:06<2:51:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6277/15526 [1:56:06<2:51:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6277/15526 [1:56:06<2:51:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6278/15526 [1:56:07<2:51:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6278/15526 [1:56:07<2:51:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6279/15526 [1:56:08<2:51:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6279/15526 [1:56:08<2:51:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6280/15526 [1:56:08<2:51:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6280/15526 [1:56:08<2:51:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6281/15526 [1:56:09<2:50:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6281/15526 [1:56:09<2:50:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6282/15526 [1:56:10<2:50:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6282/15526 [1:56:10<2:50:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6283/15526 [1:56:11<2:50:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6283/15526 [1:56:11<2:50:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6284/15526 [1:56:12<2:50:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6284/15526 [1:56:12<2:50:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6285/15526 [1:56:13<2:50:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6285/15526 [1:56:13<2:50:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6286/15526 [1:56:14<2:50:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6286/15526 [1:56:14<2:50:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6287/15526 [1:56:15<2:50:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6287/15526 [1:56:15<2:50:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 6288/15526 [1:56:15<2:50:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  40%|▍| 6288/15526 [1:56:15<2:50:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6289/15526 [1:56:17<2:50:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6289/15526 [1:56:17<2:50:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6290/15526 [1:56:18<2:50:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6290/15526 [1:56:18<2:50:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6291/15526 [1:56:19<2:50:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6291/15526 [1:56:19<2:50:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6292/15526 [1:56:19<2:50:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6292/15526 [1:56:19<2:50:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6293/15526 [1:56:20<2:50:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6293/15526 [1:56:20<2:50:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6294/15526 [1:56:21<2:50:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6294/15526 [1:56:21<2:50:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6295/15526 [1:56:22<2:50:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6295/15526 [1:56:22<2:50:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6296/15526 [1:56:22<2:50:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6296/15526 [1:56:22<2:50:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6297/15526 [1:56:23<2:50:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6297/15526 [1:56:23<2:50:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6298/15526 [1:56:24<2:50:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6298/15526 [1:56:24<2:50:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6299/15526 [1:56:24<2:50:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6299/15526 [1:56:24<2:50:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6300/15526 [1:56:26<2:50:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6300/15526 [1:56:26<2:50:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6301/15526 [1:56:26<2:50:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6301/15526 [1:56:26<2:50:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6302/15526 [1:56:27<2:50:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6302/15526 [1:56:27<2:50:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6303/15526 [1:56:28<2:50:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6303/15526 [1:56:28<2:50:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6304/15526 [1:56:37<2:50:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6304/15526 [1:56:37<2:50:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6305/15526 [1:56:38<2:50:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6305/15526 [1:56:38<2:50:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6306/15526 [1:56:39<2:50:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6306/15526 [1:56:39<2:50:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6307/15526 [1:56:40<2:50:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6307/15526 [1:56:40<2:50:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6308/15526 [1:56:41<2:50:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6308/15526 [1:56:41<2:50:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6309/15526 [1:56:42<2:50:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6309/15526 [1:56:42<2:50:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6310/15526 [1:56:42<2:50:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6310/15526 [1:56:42<2:50:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6311/15526 [1:56:43<2:50:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6311/15526 [1:56:43<2:50:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6312/15526 [1:56:44<2:50:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6312/15526 [1:56:44<2:50:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6313/15526 [1:56:45<2:50:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6313/15526 [1:56:45<2:50:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6314/15526 [1:56:46<2:50:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6314/15526 [1:56:46<2:50:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6315/15526 [1:56:47<2:50:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6315/15526 [1:56:47<2:50:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6316/15526 [1:56:49<2:50:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6316/15526 [1:56:49<2:50:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6317/15526 [1:56:50<2:50:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6317/15526 [1:56:50<2:50:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6318/15526 [1:56:50<2:50:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6318/15526 [1:56:50<2:50:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6319/15526 [1:56:51<2:50:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6319/15526 [1:56:51<2:50:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6320/15526 [1:56:52<2:50:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6320/15526 [1:56:52<2:50:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6321/15526 [1:56:53<2:50:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6321/15526 [1:56:53<2:50:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6322/15526 [1:56:54<2:50:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6322/15526 [1:56:54<2:50:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6323/15526 [1:56:55<2:50:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6323/15526 [1:56:55<2:50:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6324/15526 [1:56:55<2:50:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6324/15526 [1:56:55<2:50:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6325/15526 [1:56:56<2:50:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6325/15526 [1:56:56<2:50:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6326/15526 [1:56:57<2:50:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6326/15526 [1:56:57<2:50:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6327/15526 [1:56:58<2:50:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6327/15526 [1:56:58<2:50:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6328/15526 [1:56:59<2:50:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6328/15526 [1:56:59<2:50:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6329/15526 [1:57:00<2:50:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6329/15526 [1:57:00<2:50:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6330/15526 [1:57:00<2:49:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6330/15526 [1:57:00<2:49:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6331/15526 [1:57:01<2:49:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6331/15526 [1:57:01<2:49:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6332/15526 [1:57:02<2:49:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6332/15526 [1:57:02<2:49:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6333/15526 [1:57:03<2:49:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6333/15526 [1:57:03<2:49:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6334/15526 [1:57:05<2:49:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6334/15526 [1:57:05<2:49:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6335/15526 [1:57:05<2:49:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6335/15526 [1:57:05<2:49:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6336/15526 [1:57:12<2:49:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6336/15526 [1:57:12<2:49:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6337/15526 [1:57:12<2:49:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6337/15526 [1:57:12<2:49:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6338/15526 [1:57:14<2:49:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6338/15526 [1:57:14<2:49:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6339/15526 [1:57:14<2:49:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6339/15526 [1:57:14<2:49:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6340/15526 [1:57:15<2:49:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6340/15526 [1:57:15<2:49:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6341/15526 [1:57:16<2:49:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6341/15526 [1:57:16<2:49:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6342/15526 [1:57:17<2:49:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6342/15526 [1:57:17<2:49:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6343/15526 [1:57:18<2:49:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6343/15526 [1:57:18<2:49:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6344/15526 [1:57:19<2:49:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6344/15526 [1:57:19<2:49:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6345/15526 [1:57:20<2:49:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6345/15526 [1:57:20<2:49:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6346/15526 [1:57:21<2:49:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6346/15526 [1:57:21<2:49:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6347/15526 [1:57:22<2:49:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6347/15526 [1:57:22<2:49:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6348/15526 [1:57:22<2:49:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6348/15526 [1:57:22<2:49:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6349/15526 [1:57:23<2:49:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6349/15526 [1:57:23<2:49:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6350/15526 [1:57:24<2:49:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6350/15526 [1:57:24<2:49:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6351/15526 [1:57:24<2:49:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6351/15526 [1:57:24<2:49:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6352/15526 [1:57:25<2:49:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6352/15526 [1:57:25<2:49:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6353/15526 [1:57:26<2:49:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6353/15526 [1:57:26<2:49:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6354/15526 [1:57:27<2:49:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6354/15526 [1:57:27<2:49:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6355/15526 [1:57:28<2:49:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6355/15526 [1:57:28<2:49:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6356/15526 [1:57:29<2:49:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6356/15526 [1:57:29<2:49:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6357/15526 [1:57:31<2:49:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6357/15526 [1:57:31<2:49:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6358/15526 [1:57:32<2:49:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6358/15526 [1:57:32<2:49:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6359/15526 [1:57:32<2:49:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6359/15526 [1:57:32<2:49:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6360/15526 [1:57:33<2:49:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6360/15526 [1:57:33<2:49:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6361/15526 [1:57:34<2:49:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6361/15526 [1:57:34<2:49:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6362/15526 [1:57:34<2:49:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6362/15526 [1:57:34<2:49:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6363/15526 [1:57:36<2:49:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6363/15526 [1:57:36<2:49:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6364/15526 [1:57:37<2:49:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6364/15526 [1:57:37<2:49:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6365/15526 [1:57:38<2:49:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6365/15526 [1:57:38<2:49:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6366/15526 [1:57:39<2:49:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6366/15526 [1:57:39<2:49:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6367/15526 [1:57:39<2:49:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6367/15526 [1:57:39<2:49:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6368/15526 [1:57:45<2:49:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6368/15526 [1:57:45<2:49:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6369/15526 [1:57:46<2:49:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6369/15526 [1:57:46<2:49:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6370/15526 [1:57:48<2:49:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6370/15526 [1:57:48<2:49:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6371/15526 [1:57:48<2:49:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6371/15526 [1:57:48<2:49:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6372/15526 [1:57:50<2:49:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6372/15526 [1:57:50<2:49:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6373/15526 [1:57:51<2:49:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6373/15526 [1:57:51<2:49:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6374/15526 [1:57:51<2:49:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6374/15526 [1:57:51<2:49:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6375/15526 [1:57:53<2:49:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6375/15526 [1:57:53<2:49:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6376/15526 [1:57:54<2:49:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6376/15526 [1:57:54<2:49:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6377/15526 [1:57:54<2:49:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6377/15526 [1:57:54<2:49:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6378/15526 [1:57:56<2:49:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6378/15526 [1:57:56<2:49:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6379/15526 [1:57:56<2:49:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6379/15526 [1:57:56<2:49:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6380/15526 [1:57:57<2:49:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6380/15526 [1:57:57<2:49:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6381/15526 [1:57:58<2:49:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6381/15526 [1:57:58<2:49:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6382/15526 [1:57:59<2:49:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6382/15526 [1:57:59<2:49:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6383/15526 [1:57:59<2:49:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6383/15526 [1:57:59<2:49:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6384/15526 [1:58:00<2:49:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6384/15526 [1:58:00<2:49:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6385/15526 [1:58:02<2:48:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6385/15526 [1:58:02<2:48:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6386/15526 [1:58:02<2:48:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6386/15526 [1:58:02<2:48:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6387/15526 [1:58:03<2:48:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6387/15526 [1:58:03<2:48:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6388/15526 [1:58:04<2:48:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6388/15526 [1:58:04<2:48:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6389/15526 [1:58:04<2:48:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6389/15526 [1:58:04<2:48:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6390/15526 [1:58:05<2:48:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6390/15526 [1:58:05<2:48:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6391/15526 [1:58:06<2:48:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6391/15526 [1:58:06<2:48:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6392/15526 [1:58:07<2:48:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6392/15526 [1:58:07<2:48:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6393/15526 [1:58:09<2:48:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6393/15526 [1:58:09<2:48:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6394/15526 [1:58:10<2:48:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6394/15526 [1:58:10<2:48:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6395/15526 [1:58:11<2:48:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6395/15526 [1:58:11<2:48:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6396/15526 [1:58:12<2:48:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6396/15526 [1:58:12<2:48:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6397/15526 [1:58:12<2:48:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6397/15526 [1:58:12<2:48:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6398/15526 [1:58:13<2:48:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6398/15526 [1:58:13<2:48:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6399/15526 [1:58:14<2:48:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6399/15526 [1:58:14<2:48:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6400/15526 [1:58:22<2:48:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6400/15526 [1:58:22<2:48:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6401/15526 [1:58:46<2:49:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6401/15526 [1:58:46<2:49:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6402/15526 [1:58:47<2:49:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6402/15526 [1:58:47<2:49:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6403/15526 [1:58:49<2:49:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6403/15526 [1:58:49<2:49:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6404/15526 [1:58:50<2:49:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6404/15526 [1:58:50<2:49:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6405/15526 [1:58:50<2:49:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6405/15526 [1:58:50<2:49:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6406/15526 [1:58:51<2:49:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6406/15526 [1:58:51<2:49:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6407/15526 [1:58:52<2:49:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6407/15526 [1:58:52<2:49:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6408/15526 [1:58:53<2:49:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6408/15526 [1:58:53<2:49:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6409/15526 [1:58:54<2:49:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6409/15526 [1:58:54<2:49:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6410/15526 [1:58:55<2:49:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6410/15526 [1:58:55<2:49:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6411/15526 [1:58:56<2:49:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6411/15526 [1:58:56<2:49:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6412/15526 [1:58:56<2:49:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6412/15526 [1:58:56<2:49:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6413/15526 [1:58:58<2:49:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6413/15526 [1:58:58<2:49:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6414/15526 [1:58:59<2:49:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6414/15526 [1:58:59<2:49:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6415/15526 [1:59:00<2:49:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6415/15526 [1:59:00<2:49:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6416/15526 [1:59:01<2:49:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6416/15526 [1:59:01<2:49:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6417/15526 [1:59:02<2:48:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6417/15526 [1:59:02<2:48:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6418/15526 [1:59:02<2:48:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6418/15526 [1:59:02<2:48:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6419/15526 [1:59:04<2:48:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6419/15526 [1:59:04<2:48:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6420/15526 [1:59:04<2:48:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6420/15526 [1:59:04<2:48:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6421/15526 [1:59:05<2:48:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6421/15526 [1:59:05<2:48:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6422/15526 [1:59:06<2:48:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6422/15526 [1:59:06<2:48:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6423/15526 [1:59:07<2:48:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6423/15526 [1:59:07<2:48:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6424/15526 [1:59:07<2:48:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6424/15526 [1:59:07<2:48:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6425/15526 [1:59:08<2:48:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6425/15526 [1:59:08<2:48:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6426/15526 [1:59:09<2:48:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6426/15526 [1:59:09<2:48:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6427/15526 [1:59:10<2:48:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6427/15526 [1:59:10<2:48:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6428/15526 [1:59:11<2:48:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6428/15526 [1:59:11<2:48:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6429/15526 [1:59:12<2:48:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6429/15526 [1:59:12<2:48:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6430/15526 [1:59:13<2:48:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6430/15526 [1:59:13<2:48:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6431/15526 [1:59:14<2:48:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6431/15526 [1:59:14<2:48:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6432/15526 [1:59:20<2:48:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6432/15526 [1:59:20<2:48:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6433/15526 [1:59:21<2:48:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6433/15526 [1:59:21<2:48:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6434/15526 [1:59:21<2:48:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6434/15526 [1:59:21<2:48:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6435/15526 [1:59:22<2:48:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6435/15526 [1:59:22<2:48:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6436/15526 [1:59:23<2:48:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6436/15526 [1:59:23<2:48:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6437/15526 [1:59:23<2:48:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6437/15526 [1:59:23<2:48:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6438/15526 [1:59:25<2:48:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6438/15526 [1:59:25<2:48:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6439/15526 [1:59:25<2:48:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6439/15526 [1:59:25<2:48:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6440/15526 [1:59:26<2:48:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6440/15526 [1:59:26<2:48:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6441/15526 [1:59:27<2:48:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6441/15526 [1:59:27<2:48:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6442/15526 [1:59:27<2:48:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6442/15526 [1:59:27<2:48:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 6443/15526 [1:59:28<2:48:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  41%|▍| 6443/15526 [1:59:28<2:48:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6444/15526 [1:59:30<2:48:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6444/15526 [1:59:30<2:48:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6445/15526 [1:59:31<2:48:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6445/15526 [1:59:31<2:48:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6446/15526 [1:59:31<2:48:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6446/15526 [1:59:31<2:48:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6447/15526 [1:59:32<2:48:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6447/15526 [1:59:32<2:48:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6448/15526 [1:59:33<2:48:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6448/15526 [1:59:33<2:48:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6449/15526 [1:59:34<2:48:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6449/15526 [1:59:34<2:48:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6450/15526 [1:59:35<2:48:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6450/15526 [1:59:35<2:48:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6451/15526 [1:59:35<2:48:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6451/15526 [1:59:35<2:48:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6452/15526 [1:59:36<2:48:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6452/15526 [1:59:36<2:48:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6453/15526 [1:59:37<2:48:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6453/15526 [1:59:37<2:48:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6454/15526 [1:59:38<2:48:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6454/15526 [1:59:38<2:48:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6455/15526 [1:59:39<2:48:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6455/15526 [1:59:39<2:48:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6456/15526 [1:59:40<2:48:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6456/15526 [1:59:40<2:48:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6457/15526 [1:59:41<2:48:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6457/15526 [1:59:41<2:48:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6458/15526 [1:59:42<2:48:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6458/15526 [1:59:42<2:48:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6459/15526 [1:59:43<2:48:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6459/15526 [1:59:43<2:48:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6460/15526 [1:59:43<2:48:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6460/15526 [1:59:43<2:48:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6461/15526 [1:59:45<2:48:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6461/15526 [1:59:45<2:48:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6462/15526 [1:59:46<2:47:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6462/15526 [1:59:46<2:47:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6463/15526 [1:59:46<2:47:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6463/15526 [1:59:46<2:47:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6464/15526 [1:59:55<2:48:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6464/15526 [1:59:55<2:48:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6465/15526 [1:59:56<2:48:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6465/15526 [1:59:56<2:48:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6466/15526 [1:59:56<2:48:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6466/15526 [1:59:56<2:48:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6467/15526 [1:59:58<2:48:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6467/15526 [1:59:58<2:48:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6468/15526 [1:59:59<2:48:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6468/15526 [1:59:59<2:48:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6469/15526 [2:00:00<2:48:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6469/15526 [2:00:00<2:48:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6470/15526 [2:00:01<2:48:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6470/15526 [2:00:01<2:48:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6471/15526 [2:00:02<2:47:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6471/15526 [2:00:02<2:47:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6472/15526 [2:00:04<2:47:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6472/15526 [2:00:04<2:47:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6473/15526 [2:00:04<2:47:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6473/15526 [2:00:04<2:47:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6474/15526 [2:00:05<2:47:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6474/15526 [2:00:05<2:47:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6475/15526 [2:00:06<2:47:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6475/15526 [2:00:06<2:47:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6476/15526 [2:00:07<2:47:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6476/15526 [2:00:07<2:47:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6477/15526 [2:00:08<2:47:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6477/15526 [2:00:08<2:47:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6478/15526 [2:00:08<2:47:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6478/15526 [2:00:08<2:47:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6479/15526 [2:00:09<2:47:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6479/15526 [2:00:09<2:47:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6480/15526 [2:00:10<2:47:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6480/15526 [2:00:10<2:47:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6481/15526 [2:00:10<2:47:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6481/15526 [2:00:10<2:47:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6482/15526 [2:00:12<2:47:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6482/15526 [2:00:12<2:47:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6483/15526 [2:00:13<2:47:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6483/15526 [2:00:13<2:47:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6484/15526 [2:00:14<2:47:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6484/15526 [2:00:14<2:47:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6485/15526 [2:00:15<2:47:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6485/15526 [2:00:15<2:47:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6486/15526 [2:00:15<2:47:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6486/15526 [2:00:15<2:47:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6487/15526 [2:00:16<2:47:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6487/15526 [2:00:16<2:47:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6488/15526 [2:00:17<2:47:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6488/15526 [2:00:17<2:47:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6489/15526 [2:00:19<2:47:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6489/15526 [2:00:19<2:47:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6490/15526 [2:00:20<2:47:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6490/15526 [2:00:20<2:47:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6491/15526 [2:00:21<2:47:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6491/15526 [2:00:21<2:47:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6492/15526 [2:00:22<2:47:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6492/15526 [2:00:22<2:47:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6493/15526 [2:00:23<2:47:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6493/15526 [2:00:23<2:47:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6494/15526 [2:00:24<2:47:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6494/15526 [2:00:24<2:47:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6495/15526 [2:00:25<2:47:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6495/15526 [2:00:25<2:47:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6496/15526 [2:00:32<2:47:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6496/15526 [2:00:32<2:47:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6497/15526 [2:00:32<2:47:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6497/15526 [2:00:32<2:47:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6498/15526 [2:00:34<2:47:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6498/15526 [2:00:34<2:47:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6499/15526 [2:00:35<2:47:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6499/15526 [2:00:35<2:47:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6500/15526 [2:00:35<2:47:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6500/15526 [2:00:35<2:47:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6501/15526 [2:00:36<2:47:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6501/15526 [2:00:36<2:47:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6502/15526 [2:00:37<2:47:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6502/15526 [2:00:37<2:47:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6503/15526 [2:00:38<2:47:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6503/15526 [2:00:38<2:47:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6504/15526 [2:00:39<2:47:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6504/15526 [2:00:39<2:47:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6505/15526 [2:00:40<2:47:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6505/15526 [2:00:40<2:47:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6506/15526 [2:00:40<2:47:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6506/15526 [2:00:40<2:47:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6507/15526 [2:00:41<2:47:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6507/15526 [2:00:41<2:47:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6508/15526 [2:00:42<2:47:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6508/15526 [2:00:42<2:47:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6509/15526 [2:00:43<2:47:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6509/15526 [2:00:43<2:47:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6510/15526 [2:00:45<2:47:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6510/15526 [2:00:45<2:47:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6511/15526 [2:00:46<2:47:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6511/15526 [2:00:46<2:47:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6512/15526 [2:00:46<2:47:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6512/15526 [2:00:46<2:47:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6513/15526 [2:00:47<2:47:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6513/15526 [2:00:47<2:47:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6514/15526 [2:00:48<2:47:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6514/15526 [2:00:48<2:47:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6515/15526 [2:00:49<2:47:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6515/15526 [2:00:49<2:47:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6516/15526 [2:00:50<2:47:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6516/15526 [2:00:50<2:47:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6517/15526 [2:00:51<2:47:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6517/15526 [2:00:51<2:47:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6518/15526 [2:00:51<2:47:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6518/15526 [2:00:51<2:47:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6519/15526 [2:00:53<2:47:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6519/15526 [2:00:53<2:47:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6520/15526 [2:00:53<2:46:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6520/15526 [2:00:53<2:46:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6521/15526 [2:00:54<2:46:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6521/15526 [2:00:54<2:46:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6522/15526 [2:00:55<2:46:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6522/15526 [2:00:55<2:46:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6523/15526 [2:00:56<2:46:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6523/15526 [2:00:56<2:46:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6524/15526 [2:00:57<2:46:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6524/15526 [2:00:57<2:46:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6525/15526 [2:00:58<2:46:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6525/15526 [2:00:58<2:46:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6526/15526 [2:00:58<2:46:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6526/15526 [2:00:58<2:46:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6527/15526 [2:00:59<2:46:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6527/15526 [2:00:59<2:46:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6528/15526 [2:01:07<2:46:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6528/15526 [2:01:07<2:46:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6529/15526 [2:01:09<2:46:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6529/15526 [2:01:09<2:46:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6530/15526 [2:01:09<2:46:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6530/15526 [2:01:09<2:46:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6531/15526 [2:01:10<2:46:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6531/15526 [2:01:10<2:46:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6532/15526 [2:01:12<2:46:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6532/15526 [2:01:12<2:46:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6533/15526 [2:01:12<2:46:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6533/15526 [2:01:12<2:46:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6534/15526 [2:01:13<2:46:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6534/15526 [2:01:13<2:46:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6535/15526 [2:01:15<2:46:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6535/15526 [2:01:15<2:46:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6536/15526 [2:01:15<2:46:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6536/15526 [2:01:15<2:46:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6537/15526 [2:01:16<2:46:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6537/15526 [2:01:16<2:46:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6538/15526 [2:01:17<2:46:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6538/15526 [2:01:17<2:46:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6539/15526 [2:01:18<2:46:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6539/15526 [2:01:18<2:46:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6540/15526 [2:01:18<2:46:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6540/15526 [2:01:18<2:46:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6541/15526 [2:01:19<2:46:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6541/15526 [2:01:19<2:46:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6542/15526 [2:01:20<2:46:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6542/15526 [2:01:20<2:46:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6543/15526 [2:01:20<2:46:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6543/15526 [2:01:20<2:46:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6544/15526 [2:01:22<2:46:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6544/15526 [2:01:22<2:46:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6545/15526 [2:01:22<2:46:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6545/15526 [2:01:22<2:46:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6546/15526 [2:01:24<2:46:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6546/15526 [2:01:24<2:46:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6547/15526 [2:01:24<2:46:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6547/15526 [2:01:24<2:46:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6548/15526 [2:01:25<2:46:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6548/15526 [2:01:25<2:46:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6549/15526 [2:01:26<2:46:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6549/15526 [2:01:26<2:46:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6550/15526 [2:01:27<2:46:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6550/15526 [2:01:27<2:46:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6551/15526 [2:01:28<2:46:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6551/15526 [2:01:28<2:46:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6552/15526 [2:01:29<2:46:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6552/15526 [2:01:29<2:46:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6553/15526 [2:01:29<2:46:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6553/15526 [2:01:29<2:46:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6554/15526 [2:01:30<2:46:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6554/15526 [2:01:30<2:46:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6555/15526 [2:01:31<2:46:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6555/15526 [2:01:31<2:46:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6556/15526 [2:01:32<2:46:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6556/15526 [2:01:32<2:46:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6557/15526 [2:01:33<2:46:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6557/15526 [2:01:33<2:46:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6558/15526 [2:01:34<2:46:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6558/15526 [2:01:34<2:46:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6559/15526 [2:01:35<2:46:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6559/15526 [2:01:35<2:46:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6560/15526 [2:01:42<2:46:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6560/15526 [2:01:42<2:46:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6561/15526 [2:01:44<2:46:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6561/15526 [2:01:44<2:46:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6562/15526 [2:01:44<2:46:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6562/15526 [2:01:44<2:46:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6563/15526 [2:01:45<2:46:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6563/15526 [2:01:45<2:46:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6564/15526 [2:01:46<2:46:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6564/15526 [2:01:46<2:46:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6565/15526 [2:01:47<2:46:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6565/15526 [2:01:47<2:46:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6566/15526 [2:01:47<2:46:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6566/15526 [2:01:47<2:46:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6567/15526 [2:01:48<2:46:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6567/15526 [2:01:48<2:46:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6568/15526 [2:01:49<2:46:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6568/15526 [2:01:49<2:46:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6569/15526 [2:01:49<2:46:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6569/15526 [2:01:49<2:46:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6570/15526 [2:01:50<2:46:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6570/15526 [2:01:50<2:46:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6571/15526 [2:01:51<2:46:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6571/15526 [2:01:51<2:46:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6572/15526 [2:01:52<2:46:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6572/15526 [2:01:52<2:46:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6573/15526 [2:01:53<2:46:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6573/15526 [2:01:53<2:46:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6574/15526 [2:01:54<2:46:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6574/15526 [2:01:54<2:46:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6575/15526 [2:01:55<2:45:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6575/15526 [2:01:55<2:45:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6576/15526 [2:01:56<2:45:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6576/15526 [2:01:56<2:45:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6577/15526 [2:01:57<2:45:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6577/15526 [2:01:57<2:45:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6578/15526 [2:01:57<2:45:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6578/15526 [2:01:57<2:45:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6579/15526 [2:01:58<2:45:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6579/15526 [2:01:58<2:45:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6580/15526 [2:01:59<2:45:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6580/15526 [2:01:59<2:45:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6581/15526 [2:01:59<2:45:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6581/15526 [2:01:59<2:45:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6582/15526 [2:02:01<2:45:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6582/15526 [2:02:01<2:45:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6583/15526 [2:02:01<2:45:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6583/15526 [2:02:01<2:45:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6584/15526 [2:02:02<2:45:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6584/15526 [2:02:02<2:45:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6585/15526 [2:02:03<2:45:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6585/15526 [2:02:03<2:45:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6586/15526 [2:02:04<2:45:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6586/15526 [2:02:04<2:45:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6587/15526 [2:02:04<2:45:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6587/15526 [2:02:04<2:45:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6588/15526 [2:02:05<2:45:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6588/15526 [2:02:05<2:45:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6589/15526 [2:02:06<2:45:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6589/15526 [2:02:06<2:45:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6590/15526 [2:02:07<2:45:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6590/15526 [2:02:07<2:45:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6591/15526 [2:02:08<2:45:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6591/15526 [2:02:08<2:45:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6592/15526 [2:02:16<2:45:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6592/15526 [2:02:16<2:45:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6593/15526 [2:02:17<2:45:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6593/15526 [2:02:17<2:45:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6594/15526 [2:02:18<2:45:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6594/15526 [2:02:18<2:45:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6595/15526 [2:02:19<2:45:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6595/15526 [2:02:19<2:45:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6596/15526 [2:02:21<2:45:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6596/15526 [2:02:21<2:45:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6597/15526 [2:02:22<2:45:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6597/15526 [2:02:22<2:45:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 6598/15526 [2:02:22<2:45:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  42%|▍| 6598/15526 [2:02:22<2:45:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6599/15526 [2:02:23<2:45:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6599/15526 [2:02:23<2:45:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6600/15526 [2:02:24<2:45:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6600/15526 [2:02:24<2:45:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6601/15526 [2:02:24<2:45:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6601/15526 [2:02:24<2:45:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6602/15526 [2:02:25<2:45:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6602/15526 [2:02:25<2:45:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6603/15526 [2:02:26<2:45:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6603/15526 [2:02:26<2:45:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6604/15526 [2:02:27<2:45:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6604/15526 [2:02:27<2:45:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6605/15526 [2:02:28<2:45:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6605/15526 [2:02:28<2:45:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6606/15526 [2:02:28<2:45:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6606/15526 [2:02:28<2:45:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6607/15526 [2:02:29<2:45:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6607/15526 [2:02:29<2:45:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6608/15526 [2:02:30<2:45:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6608/15526 [2:02:30<2:45:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6609/15526 [2:02:30<2:45:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6609/15526 [2:02:30<2:45:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6610/15526 [2:02:31<2:45:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6610/15526 [2:02:31<2:45:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6611/15526 [2:02:32<2:45:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6611/15526 [2:02:32<2:45:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6612/15526 [2:02:33<2:45:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6612/15526 [2:02:33<2:45:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6613/15526 [2:02:33<2:45:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6613/15526 [2:02:33<2:45:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6614/15526 [2:02:34<2:45:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6614/15526 [2:02:34<2:45:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6615/15526 [2:02:35<2:45:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6615/15526 [2:02:35<2:45:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6616/15526 [2:02:37<2:45:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6616/15526 [2:02:37<2:45:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6617/15526 [2:02:38<2:45:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6617/15526 [2:02:38<2:45:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6618/15526 [2:02:38<2:45:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6618/15526 [2:02:38<2:45:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6619/15526 [2:02:39<2:45:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6619/15526 [2:02:39<2:45:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6620/15526 [2:02:40<2:45:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6620/15526 [2:02:40<2:45:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6621/15526 [2:02:40<2:45:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6621/15526 [2:02:40<2:45:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6622/15526 [2:02:41<2:44:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6622/15526 [2:02:41<2:44:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6623/15526 [2:02:42<2:44:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6623/15526 [2:02:42<2:44:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6624/15526 [2:02:53<2:45:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6624/15526 [2:02:53<2:45:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6625/15526 [2:02:54<2:45:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6625/15526 [2:02:54<2:45:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6626/15526 [2:02:55<2:45:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6626/15526 [2:02:55<2:45:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6627/15526 [2:02:55<2:45:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6627/15526 [2:02:55<2:45:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6628/15526 [2:02:56<2:45:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6628/15526 [2:02:56<2:45:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6629/15526 [2:02:57<2:45:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6629/15526 [2:02:57<2:45:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6630/15526 [2:02:57<2:44:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6630/15526 [2:02:57<2:44:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6631/15526 [2:02:59<2:44:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6631/15526 [2:02:59<2:44:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6632/15526 [2:02:59<2:44:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6632/15526 [2:02:59<2:44:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6633/15526 [2:03:00<2:44:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6633/15526 [2:03:00<2:44:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6634/15526 [2:03:02<2:44:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6634/15526 [2:03:02<2:44:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6635/15526 [2:03:03<2:44:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6635/15526 [2:03:03<2:44:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6636/15526 [2:03:04<2:44:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6636/15526 [2:03:04<2:44:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6637/15526 [2:03:05<2:44:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6637/15526 [2:03:05<2:44:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6638/15526 [2:03:06<2:44:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6638/15526 [2:03:06<2:44:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6639/15526 [2:03:08<2:44:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6639/15526 [2:03:08<2:44:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6640/15526 [2:03:09<2:44:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6640/15526 [2:03:09<2:44:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6641/15526 [2:03:10<2:44:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6641/15526 [2:03:10<2:44:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6642/15526 [2:03:11<2:44:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6642/15526 [2:03:11<2:44:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6643/15526 [2:03:11<2:44:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6643/15526 [2:03:11<2:44:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6644/15526 [2:03:13<2:44:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6644/15526 [2:03:13<2:44:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6645/15526 [2:03:13<2:44:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6645/15526 [2:03:13<2:44:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6646/15526 [2:03:14<2:44:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6646/15526 [2:03:14<2:44:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6647/15526 [2:03:15<2:44:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6647/15526 [2:03:15<2:44:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6648/15526 [2:03:16<2:44:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6648/15526 [2:03:16<2:44:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6649/15526 [2:03:16<2:44:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6649/15526 [2:03:16<2:44:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6650/15526 [2:03:17<2:44:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6650/15526 [2:03:17<2:44:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6651/15526 [2:03:18<2:44:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6651/15526 [2:03:18<2:44:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6652/15526 [2:03:18<2:44:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6652/15526 [2:03:18<2:44:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6653/15526 [2:03:20<2:44:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6653/15526 [2:03:20<2:44:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6654/15526 [2:03:20<2:44:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6654/15526 [2:03:20<2:44:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6655/15526 [2:03:21<2:44:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6655/15526 [2:03:21<2:44:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6656/15526 [2:03:29<2:44:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6656/15526 [2:03:29<2:44:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6657/15526 [2:03:30<2:44:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6657/15526 [2:03:30<2:44:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6658/15526 [2:03:31<2:44:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6658/15526 [2:03:31<2:44:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6659/15526 [2:03:32<2:44:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6659/15526 [2:03:32<2:44:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6660/15526 [2:03:33<2:44:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6660/15526 [2:03:33<2:44:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6661/15526 [2:03:33<2:44:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6661/15526 [2:03:33<2:44:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6662/15526 [2:03:34<2:44:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6662/15526 [2:03:34<2:44:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6663/15526 [2:03:35<2:44:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6663/15526 [2:03:35<2:44:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6664/15526 [2:03:36<2:44:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6664/15526 [2:03:36<2:44:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6665/15526 [2:03:37<2:44:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6665/15526 [2:03:37<2:44:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6666/15526 [2:03:37<2:44:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6666/15526 [2:03:37<2:44:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6667/15526 [2:03:38<2:44:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6667/15526 [2:03:38<2:44:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6668/15526 [2:03:39<2:44:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6668/15526 [2:03:39<2:44:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6669/15526 [2:03:39<2:44:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6669/15526 [2:03:39<2:44:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6670/15526 [2:03:41<2:44:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6670/15526 [2:03:41<2:44:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6671/15526 [2:03:41<2:44:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6671/15526 [2:03:41<2:44:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6672/15526 [2:03:42<2:44:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6672/15526 [2:03:42<2:44:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6673/15526 [2:03:43<2:44:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6673/15526 [2:03:43<2:44:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6674/15526 [2:03:44<2:44:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6674/15526 [2:03:44<2:44:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6675/15526 [2:03:45<2:44:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6675/15526 [2:03:45<2:44:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6676/15526 [2:03:46<2:44:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6676/15526 [2:03:46<2:44:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6677/15526 [2:03:46<2:44:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6677/15526 [2:03:46<2:44:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6678/15526 [2:03:47<2:44:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6678/15526 [2:03:47<2:44:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6679/15526 [2:03:48<2:44:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6679/15526 [2:03:48<2:44:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6680/15526 [2:03:49<2:43:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6680/15526 [2:03:49<2:43:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6681/15526 [2:03:50<2:43:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6681/15526 [2:03:50<2:43:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6682/15526 [2:03:51<2:43:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6682/15526 [2:03:51<2:43:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6683/15526 [2:03:52<2:43:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6683/15526 [2:03:52<2:43:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6684/15526 [2:03:52<2:43:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6684/15526 [2:03:52<2:43:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6685/15526 [2:03:53<2:43:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6685/15526 [2:03:53<2:43:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6686/15526 [2:03:54<2:43:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6686/15526 [2:03:54<2:43:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6687/15526 [2:03:55<2:43:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6687/15526 [2:03:55<2:43:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6688/15526 [2:04:03<2:43:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6688/15526 [2:04:03<2:43:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6689/15526 [2:04:04<2:43:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6689/15526 [2:04:04<2:43:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6690/15526 [2:04:05<2:43:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6690/15526 [2:04:05<2:43:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6691/15526 [2:04:05<2:43:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6691/15526 [2:04:05<2:43:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6692/15526 [2:04:06<2:43:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6692/15526 [2:04:06<2:43:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6693/15526 [2:04:07<2:43:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6693/15526 [2:04:07<2:43:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6694/15526 [2:04:08<2:43:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6694/15526 [2:04:08<2:43:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6695/15526 [2:04:09<2:43:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6695/15526 [2:04:09<2:43:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6696/15526 [2:04:09<2:43:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6696/15526 [2:04:09<2:43:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6697/15526 [2:04:10<2:43:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6697/15526 [2:04:10<2:43:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6698/15526 [2:04:11<2:43:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6698/15526 [2:04:11<2:43:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6699/15526 [2:04:11<2:43:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6699/15526 [2:04:11<2:43:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6700/15526 [2:04:13<2:43:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6700/15526 [2:04:13<2:43:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6701/15526 [2:04:13<2:43:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6701/15526 [2:04:13<2:43:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6702/15526 [2:04:15<2:43:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6702/15526 [2:04:15<2:43:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|��| 6703/15526 [2:04:16<2:43:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6703/15526 [2:04:16<2:43:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6704/15526 [2:04:16<2:43:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6704/15526 [2:04:16<2:43:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6705/15526 [2:04:17<2:43:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6705/15526 [2:04:17<2:43:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6706/15526 [2:04:18<2:43:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6706/15526 [2:04:18<2:43:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6707/15526 [2:04:19<2:43:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6707/15526 [2:04:19<2:43:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6708/15526 [2:04:20<2:43:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6708/15526 [2:04:20<2:43:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6709/15526 [2:04:21<2:43:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6709/15526 [2:04:21<2:43:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6710/15526 [2:04:22<2:43:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6710/15526 [2:04:22<2:43:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6711/15526 [2:04:23<2:43:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6711/15526 [2:04:23<2:43:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6712/15526 [2:04:25<2:43:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6712/15526 [2:04:25<2:43:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6713/15526 [2:04:25<2:43:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6713/15526 [2:04:25<2:43:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6714/15526 [2:04:26<2:43:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6714/15526 [2:04:26<2:43:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6715/15526 [2:04:27<2:43:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6715/15526 [2:04:27<2:43:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6716/15526 [2:04:28<2:43:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6716/15526 [2:04:28<2:43:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6717/15526 [2:04:28<2:43:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6717/15526 [2:04:28<2:43:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6718/15526 [2:04:29<2:43:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6718/15526 [2:04:29<2:43:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6719/15526 [2:04:30<2:43:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6719/15526 [2:04:30<2:43:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6720/15526 [2:04:37<2:43:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6720/15526 [2:04:37<2:43:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6721/15526 [2:04:38<2:43:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6721/15526 [2:04:38<2:43:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6722/15526 [2:04:39<2:43:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6722/15526 [2:04:39<2:43:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6723/15526 [2:04:39<2:43:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6723/15526 [2:04:39<2:43:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6724/15526 [2:04:40<2:43:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6724/15526 [2:04:40<2:43:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6725/15526 [2:04:41<2:43:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6725/15526 [2:04:41<2:43:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6726/15526 [2:04:42<2:43:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6726/15526 [2:04:42<2:43:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6727/15526 [2:04:42<2:43:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6727/15526 [2:04:42<2:43:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6728/15526 [2:04:43<2:43:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6728/15526 [2:04:43<2:43:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6729/15526 [2:04:44<2:43:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6729/15526 [2:04:44<2:43:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6730/15526 [2:04:44<2:43:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6730/15526 [2:04:44<2:43:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6731/15526 [2:04:45<2:43:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6731/15526 [2:04:45<2:43:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6732/15526 [2:04:46<2:43:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6732/15526 [2:04:46<2:43:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6733/15526 [2:04:47<2:42:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6733/15526 [2:04:47<2:42:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6734/15526 [2:04:48<2:42:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6734/15526 [2:04:48<2:42:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6735/15526 [2:04:49<2:42:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6735/15526 [2:04:49<2:42:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6736/15526 [2:04:50<2:42:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6736/15526 [2:04:50<2:42:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6737/15526 [2:04:51<2:42:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6737/15526 [2:04:51<2:42:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6738/15526 [2:04:52<2:42:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6738/15526 [2:04:52<2:42:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6739/15526 [2:04:53<2:42:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6739/15526 [2:04:53<2:42:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6740/15526 [2:04:54<2:42:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6740/15526 [2:04:54<2:42:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6741/15526 [2:04:55<2:42:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6741/15526 [2:04:55<2:42:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6742/15526 [2:04:56<2:42:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6742/15526 [2:04:56<2:42:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6743/15526 [2:04:57<2:42:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6743/15526 [2:04:57<2:42:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6744/15526 [2:04:58<2:42:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6744/15526 [2:04:58<2:42:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6745/15526 [2:04:59<2:42:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6745/15526 [2:04:59<2:42:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6746/15526 [2:05:00<2:42:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6746/15526 [2:05:00<2:42:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6747/15526 [2:05:01<2:42:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6747/15526 [2:05:01<2:42:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6748/15526 [2:05:02<2:42:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6748/15526 [2:05:02<2:42:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6749/15526 [2:05:03<2:42:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6749/15526 [2:05:03<2:42:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6750/15526 [2:05:04<2:42:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6750/15526 [2:05:04<2:42:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6751/15526 [2:05:04<2:42:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6751/15526 [2:05:04<2:42:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6752/15526 [2:05:11<2:42:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6752/15526 [2:05:11<2:42:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 6753/15526 [2:05:11<2:42:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  43%|▍| 6753/15526 [2:05:11<2:42:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6754/15526 [2:05:12<2:42:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6754/15526 [2:05:12<2:42:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6755/15526 [2:05:14<2:42:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6755/15526 [2:05:14<2:42:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6756/15526 [2:05:14<2:42:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6756/15526 [2:05:14<2:42:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6757/15526 [2:05:16<2:42:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6757/15526 [2:05:16<2:42:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6758/15526 [2:05:16<2:42:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6758/15526 [2:05:16<2:42:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6759/15526 [2:05:17<2:42:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6759/15526 [2:05:17<2:42:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6760/15526 [2:05:18<2:42:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6760/15526 [2:05:18<2:42:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6761/15526 [2:05:18<2:42:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6761/15526 [2:05:18<2:42:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6762/15526 [2:05:19<2:42:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6762/15526 [2:05:19<2:42:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6763/15526 [2:05:20<2:42:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6763/15526 [2:05:20<2:42:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6764/15526 [2:05:21<2:42:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6764/15526 [2:05:21<2:42:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6765/15526 [2:05:22<2:42:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6765/15526 [2:05:22<2:42:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6766/15526 [2:05:23<2:42:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6766/15526 [2:05:23<2:42:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6767/15526 [2:05:24<2:42:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6767/15526 [2:05:24<2:42:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6768/15526 [2:05:25<2:42:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6768/15526 [2:05:25<2:42:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6769/15526 [2:05:26<2:42:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6769/15526 [2:05:26<2:42:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6770/15526 [2:05:28<2:42:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6770/15526 [2:05:28<2:42:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6771/15526 [2:05:28<2:42:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6771/15526 [2:05:28<2:42:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6772/15526 [2:05:29<2:42:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6772/15526 [2:05:29<2:42:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6773/15526 [2:05:30<2:42:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6773/15526 [2:05:30<2:42:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6774/15526 [2:05:31<2:42:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6774/15526 [2:05:31<2:42:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6775/15526 [2:05:32<2:42:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6775/15526 [2:05:32<2:42:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6776/15526 [2:05:33<2:42:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6776/15526 [2:05:33<2:42:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6777/15526 [2:05:33<2:42:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6777/15526 [2:05:33<2:42:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6778/15526 [2:05:34<2:42:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6778/15526 [2:05:34<2:42:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6779/15526 [2:05:35<2:42:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6779/15526 [2:05:35<2:42:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6780/15526 [2:05:35<2:42:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6780/15526 [2:05:36<2:42:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6781/15526 [2:05:37<2:42:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6781/15526 [2:05:37<2:42:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6782/15526 [2:05:37<2:41:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6782/15526 [2:05:37<2:41:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6783/15526 [2:05:39<2:41:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6783/15526 [2:05:39<2:41:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6784/15526 [2:05:47<2:42:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6784/15526 [2:05:47<2:42:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6785/15526 [2:05:48<2:42:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6785/15526 [2:05:48<2:42:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6786/15526 [2:05:49<2:42:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6786/15526 [2:05:49<2:42:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6787/15526 [2:05:50<2:42:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6787/15526 [2:05:50<2:42:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6788/15526 [2:05:50<2:42:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6788/15526 [2:05:50<2:42:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6789/15526 [2:05:52<2:41:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6789/15526 [2:05:52<2:41:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6790/15526 [2:05:52<2:41:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6790/15526 [2:05:52<2:41:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6791/15526 [2:05:53<2:41:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6791/15526 [2:05:53<2:41:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6792/15526 [2:05:54<2:41:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6792/15526 [2:05:54<2:41:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6793/15526 [2:05:55<2:41:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6793/15526 [2:05:55<2:41:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6794/15526 [2:05:56<2:41:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6794/15526 [2:05:56<2:41:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6795/15526 [2:05:57<2:41:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6795/15526 [2:05:57<2:41:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6796/15526 [2:05:58<2:41:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6796/15526 [2:05:58<2:41:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6797/15526 [2:05:59<2:41:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6797/15526 [2:05:59<2:41:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6798/15526 [2:05:59<2:41:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6798/15526 [2:05:59<2:41:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6799/15526 [2:06:00<2:41:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6799/15526 [2:06:00<2:41:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6800/15526 [2:06:01<2:41:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6800/15526 [2:06:01<2:41:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6801/15526 [2:06:01<2:41:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6801/15526 [2:06:01<2:41:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6802/15526 [2:06:02<2:41:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6802/15526 [2:06:02<2:41:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6803/15526 [2:06:03<2:41:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6803/15526 [2:06:03<2:41:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6804/15526 [2:06:04<2:41:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6804/15526 [2:06:04<2:41:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6805/15526 [2:06:05<2:41:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6805/15526 [2:06:05<2:41:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6806/15526 [2:06:06<2:41:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6806/15526 [2:06:06<2:41:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6807/15526 [2:06:06<2:41:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6807/15526 [2:06:06<2:41:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6808/15526 [2:06:07<2:41:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6808/15526 [2:06:07<2:41:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6809/15526 [2:06:08<2:41:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6809/15526 [2:06:08<2:41:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6810/15526 [2:06:09<2:41:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6810/15526 [2:06:09<2:41:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6811/15526 [2:06:11<2:41:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6811/15526 [2:06:11<2:41:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6812/15526 [2:06:11<2:41:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6812/15526 [2:06:11<2:41:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6813/15526 [2:06:12<2:41:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6813/15526 [2:06:12<2:41:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6814/15526 [2:06:13<2:41:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6814/15526 [2:06:13<2:41:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6815/15526 [2:06:14<2:41:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6815/15526 [2:06:14<2:41:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6816/15526 [2:06:22<2:41:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6816/15526 [2:06:22<2:41:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6817/15526 [2:06:23<2:41:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6817/15526 [2:06:23<2:41:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6818/15526 [2:06:24<2:41:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6818/15526 [2:06:24<2:41:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6819/15526 [2:06:24<2:41:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6819/15526 [2:06:24<2:41:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6820/15526 [2:06:25<2:41:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6820/15526 [2:06:25<2:41:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6821/15526 [2:06:26<2:41:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6821/15526 [2:06:26<2:41:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6822/15526 [2:06:26<2:41:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6822/15526 [2:06:26<2:41:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6823/15526 [2:06:27<2:41:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6823/15526 [2:06:27<2:41:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6824/15526 [2:06:28<2:41:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6824/15526 [2:06:28<2:41:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6825/15526 [2:06:28<2:41:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6825/15526 [2:06:28<2:41:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6826/15526 [2:06:30<2:41:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6826/15526 [2:06:30<2:41:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6827/15526 [2:06:30<2:41:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6827/15526 [2:06:30<2:41:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6828/15526 [2:06:31<2:41:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6828/15526 [2:06:31<2:41:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6829/15526 [2:06:33<2:41:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6829/15526 [2:06:33<2:41:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6830/15526 [2:06:34<2:41:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6830/15526 [2:06:34<2:41:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6831/15526 [2:06:35<2:41:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6831/15526 [2:06:35<2:41:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6832/15526 [2:06:36<2:41:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6832/15526 [2:06:36<2:41:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6833/15526 [2:06:36<2:41:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6833/15526 [2:06:36<2:41:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6834/15526 [2:06:37<2:41:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6834/15526 [2:06:37<2:41:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6835/15526 [2:06:38<2:41:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6835/15526 [2:06:38<2:41:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6836/15526 [2:06:38<2:40:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6836/15526 [2:06:38<2:40:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6837/15526 [2:06:39<2:40:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6837/15526 [2:06:39<2:40:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6838/15526 [2:06:40<2:40:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6838/15526 [2:06:40<2:40:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6839/15526 [2:06:41<2:40:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6839/15526 [2:06:41<2:40:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6840/15526 [2:06:41<2:40:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6840/15526 [2:06:41<2:40:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6841/15526 [2:06:43<2:40:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6841/15526 [2:06:43<2:40:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6842/15526 [2:06:43<2:40:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6842/15526 [2:06:43<2:40:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6843/15526 [2:06:44<2:40:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6843/15526 [2:06:44<2:40:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6844/15526 [2:06:45<2:40:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6844/15526 [2:06:45<2:40:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6845/15526 [2:06:45<2:40:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6845/15526 [2:06:45<2:40:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6846/15526 [2:06:47<2:40:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6846/15526 [2:06:47<2:40:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6847/15526 [2:06:48<2:40:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6847/15526 [2:06:48<2:40:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6848/15526 [2:06:57<2:40:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6848/15526 [2:06:57<2:40:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6849/15526 [2:06:58<2:40:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6849/15526 [2:06:58<2:40:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6850/15526 [2:06:59<2:40:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6850/15526 [2:06:59<2:40:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6851/15526 [2:07:00<2:40:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6851/15526 [2:07:00<2:40:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6852/15526 [2:07:01<2:40:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6852/15526 [2:07:01<2:40:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6853/15526 [2:07:01<2:40:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6853/15526 [2:07:01<2:40:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6854/15526 [2:07:02<2:40:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6854/15526 [2:07:02<2:40:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6855/15526 [2:07:04<2:40:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6855/15526 [2:07:04<2:40:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6856/15526 [2:07:05<2:40:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6856/15526 [2:07:05<2:40:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6857/15526 [2:07:06<2:40:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6857/15526 [2:07:06<2:40:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6858/15526 [2:07:07<2:40:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6858/15526 [2:07:07<2:40:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6859/15526 [2:07:07<2:40:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6859/15526 [2:07:07<2:40:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6860/15526 [2:07:08<2:40:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6860/15526 [2:07:08<2:40:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6861/15526 [2:07:09<2:40:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6861/15526 [2:07:09<2:40:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6862/15526 [2:07:10<2:40:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6862/15526 [2:07:10<2:40:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6863/15526 [2:07:11<2:40:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6863/15526 [2:07:11<2:40:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6864/15526 [2:07:13<2:40:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6864/15526 [2:07:13<2:40:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6865/15526 [2:07:14<2:40:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6865/15526 [2:07:14<2:40:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6866/15526 [2:07:15<2:40:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6866/15526 [2:07:15<2:40:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6867/15526 [2:07:16<2:40:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6867/15526 [2:07:16<2:40:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6868/15526 [2:07:16<2:40:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6868/15526 [2:07:16<2:40:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6869/15526 [2:07:18<2:40:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6869/15526 [2:07:18<2:40:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6870/15526 [2:07:19<2:40:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6870/15526 [2:07:19<2:40:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6871/15526 [2:07:20<2:40:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6871/15526 [2:07:20<2:40:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6872/15526 [2:07:21<2:40:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6872/15526 [2:07:21<2:40:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6873/15526 [2:07:22<2:40:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6873/15526 [2:07:22<2:40:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6874/15526 [2:07:23<2:40:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6874/15526 [2:07:23<2:40:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6875/15526 [2:07:24<2:40:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6875/15526 [2:07:24<2:40:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6876/15526 [2:07:25<2:40:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6876/15526 [2:07:25<2:40:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6877/15526 [2:07:26<2:40:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6877/15526 [2:07:26<2:40:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6878/15526 [2:07:27<2:40:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6878/15526 [2:07:27<2:40:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6879/15526 [2:07:28<2:40:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6879/15526 [2:07:28<2:40:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6880/15526 [2:07:33<2:40:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6880/15526 [2:07:33<2:40:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6881/15526 [2:07:34<2:40:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6881/15526 [2:07:34<2:40:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6882/15526 [2:07:35<2:40:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6882/15526 [2:07:35<2:40:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6883/15526 [2:07:36<2:40:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6883/15526 [2:07:36<2:40:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6884/15526 [2:07:37<2:40:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6884/15526 [2:07:37<2:40:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6885/15526 [2:07:37<2:40:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6885/15526 [2:07:37<2:40:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6886/15526 [2:07:38<2:40:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6886/15526 [2:07:38<2:40:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6887/15526 [2:07:39<2:40:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6887/15526 [2:07:39<2:40:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6888/15526 [2:07:40<2:40:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6888/15526 [2:07:40<2:40:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6889/15526 [2:07:41<2:40:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6889/15526 [2:07:41<2:40:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6890/15526 [2:07:42<2:40:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6890/15526 [2:07:42<2:40:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6891/15526 [2:07:42<2:40:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6891/15526 [2:07:42<2:40:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6892/15526 [2:07:43<2:40:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6892/15526 [2:07:43<2:40:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6893/15526 [2:07:44<2:39:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6893/15526 [2:07:44<2:39:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6894/15526 [2:07:45<2:39:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6894/15526 [2:07:45<2:39:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6895/15526 [2:07:46<2:39:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6895/15526 [2:07:46<2:39:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6896/15526 [2:07:47<2:39:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6896/15526 [2:07:47<2:39:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6897/15526 [2:07:47<2:39:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6897/15526 [2:07:47<2:39:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6898/15526 [2:07:48<2:39:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6898/15526 [2:07:48<2:39:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6899/15526 [2:07:49<2:39:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6899/15526 [2:07:49<2:39:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6900/15526 [2:07:50<2:39:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6900/15526 [2:07:50<2:39:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6901/15526 [2:07:51<2:39:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6901/15526 [2:07:51<2:39:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6902/15526 [2:07:52<2:39:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6902/15526 [2:07:52<2:39:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6903/15526 [2:07:52<2:39:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6903/15526 [2:07:52<2:39:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6904/15526 [2:07:54<2:39:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6904/15526 [2:07:54<2:39:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6905/15526 [2:07:55<2:39:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6905/15526 [2:07:55<2:39:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6906/15526 [2:07:56<2:39:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6906/15526 [2:07:56<2:39:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6907/15526 [2:07:57<2:39:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6907/15526 [2:07:57<2:39:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6908/15526 [2:07:57<2:39:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6908/15526 [2:07:57<2:39:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 6909/15526 [2:07:58<2:39:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  44%|▍| 6909/15526 [2:07:58<2:39:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6910/15526 [2:07:59<2:39:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6910/15526 [2:07:59<2:39:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6911/15526 [2:08:00<2:39:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6911/15526 [2:08:01<2:39:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6912/15526 [2:08:08<2:39:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6912/15526 [2:08:08<2:39:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6913/15526 [2:08:09<2:39:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6913/15526 [2:08:09<2:39:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6914/15526 [2:08:09<2:39:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6914/15526 [2:08:09<2:39:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6915/15526 [2:08:10<2:39:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6915/15526 [2:08:10<2:39:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6916/15526 [2:08:11<2:39:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6916/15526 [2:08:11<2:39:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6917/15526 [2:08:12<2:39:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6917/15526 [2:08:12<2:39:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6918/15526 [2:08:13<2:39:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6918/15526 [2:08:13<2:39:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6919/15526 [2:08:14<2:39:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6919/15526 [2:08:14<2:39:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6920/15526 [2:08:15<2:39:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6920/15526 [2:08:15<2:39:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6921/15526 [2:08:16<2:39:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6921/15526 [2:08:16<2:39:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6922/15526 [2:08:17<2:39:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6922/15526 [2:08:17<2:39:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6923/15526 [2:08:18<2:39:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6923/15526 [2:08:18<2:39:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6924/15526 [2:08:20<2:39:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6924/15526 [2:08:20<2:39:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6925/15526 [2:08:20<2:39:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6925/15526 [2:08:20<2:39:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6926/15526 [2:08:21<2:39:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6926/15526 [2:08:21<2:39:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6927/15526 [2:08:22<2:39:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6927/15526 [2:08:22<2:39:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6928/15526 [2:08:23<2:39:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6928/15526 [2:08:23<2:39:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6929/15526 [2:08:24<2:39:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6929/15526 [2:08:24<2:39:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6930/15526 [2:08:24<2:39:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6930/15526 [2:08:24<2:39:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6931/15526 [2:08:25<2:39:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6931/15526 [2:08:25<2:39:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6932/15526 [2:08:26<2:39:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6932/15526 [2:08:26<2:39:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6933/15526 [2:08:26<2:39:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6933/15526 [2:08:26<2:39:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6934/15526 [2:08:28<2:39:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6934/15526 [2:08:28<2:39:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6935/15526 [2:08:28<2:39:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6935/15526 [2:08:28<2:39:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6936/15526 [2:08:29<2:39:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6936/15526 [2:08:29<2:39:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6937/15526 [2:08:30<2:39:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6937/15526 [2:08:30<2:39:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6938/15526 [2:08:30<2:39:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6938/15526 [2:08:30<2:39:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6939/15526 [2:08:32<2:39:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6939/15526 [2:08:32<2:39:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6940/15526 [2:08:32<2:39:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6940/15526 [2:08:32<2:39:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6941/15526 [2:08:33<2:39:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6941/15526 [2:08:33<2:39:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6942/15526 [2:08:34<2:38:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6942/15526 [2:08:34<2:38:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6943/15526 [2:08:34<2:38:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6943/15526 [2:08:34<2:38:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6944/15526 [2:08:41<2:39:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6944/15526 [2:08:41<2:39:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6945/15526 [2:08:42<2:39:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6945/15526 [2:08:42<2:39:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6946/15526 [2:08:43<2:39:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6946/15526 [2:08:43<2:39:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6947/15526 [2:08:44<2:38:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6947/15526 [2:08:44<2:38:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6948/15526 [2:08:45<2:38:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6948/15526 [2:08:45<2:38:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6949/15526 [2:08:45<2:38:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6949/15526 [2:08:45<2:38:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6950/15526 [2:08:46<2:38:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6950/15526 [2:08:46<2:38:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6951/15526 [2:08:47<2:38:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6951/15526 [2:08:47<2:38:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6952/15526 [2:08:48<2:38:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6952/15526 [2:08:48<2:38:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6953/15526 [2:08:49<2:38:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6953/15526 [2:08:49<2:38:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6954/15526 [2:08:50<2:38:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6954/15526 [2:08:50<2:38:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6955/15526 [2:08:51<2:38:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6955/15526 [2:08:51<2:38:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6956/15526 [2:08:52<2:38:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6956/15526 [2:08:52<2:38:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6957/15526 [2:08:53<2:38:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6957/15526 [2:08:53<2:38:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6958/15526 [2:08:54<2:38:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6958/15526 [2:08:54<2:38:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6959/15526 [2:08:55<2:38:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6959/15526 [2:08:55<2:38:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6960/15526 [2:08:55<2:38:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6960/15526 [2:08:55<2:38:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6961/15526 [2:08:56<2:38:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6961/15526 [2:08:56<2:38:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6962/15526 [2:08:57<2:38:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6962/15526 [2:08:57<2:38:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6963/15526 [2:08:58<2:38:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6963/15526 [2:08:58<2:38:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6964/15526 [2:08:59<2:38:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6964/15526 [2:08:59<2:38:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6965/15526 [2:08:59<2:38:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6965/15526 [2:08:59<2:38:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6966/15526 [2:09:00<2:38:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6966/15526 [2:09:00<2:38:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6967/15526 [2:09:01<2:38:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6967/15526 [2:09:01<2:38:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6968/15526 [2:09:02<2:38:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6968/15526 [2:09:02<2:38:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6969/15526 [2:09:02<2:38:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6969/15526 [2:09:02<2:38:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6970/15526 [2:09:03<2:38:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6970/15526 [2:09:03<2:38:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6971/15526 [2:09:04<2:38:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6971/15526 [2:09:04<2:38:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6972/15526 [2:09:04<2:38:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6972/15526 [2:09:04<2:38:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6973/15526 [2:09:05<2:38:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6973/15526 [2:09:05<2:38:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6974/15526 [2:09:06<2:38:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6974/15526 [2:09:06<2:38:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6975/15526 [2:09:07<2:38:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6975/15526 [2:09:07<2:38:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6976/15526 [2:09:16<2:38:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6976/15526 [2:09:16<2:38:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6977/15526 [2:09:17<2:38:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6977/15526 [2:09:17<2:38:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6978/15526 [2:09:18<2:38:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6978/15526 [2:09:18<2:38:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6979/15526 [2:09:19<2:38:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6979/15526 [2:09:19<2:38:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6980/15526 [2:09:19<2:38:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6980/15526 [2:09:19<2:38:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6981/15526 [2:09:20<2:38:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6981/15526 [2:09:20<2:38:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6982/15526 [2:09:21<2:38:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6982/15526 [2:09:21<2:38:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6983/15526 [2:09:21<2:38:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6983/15526 [2:09:21<2:38:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6984/15526 [2:09:23<2:38:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6984/15526 [2:09:23<2:38:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6985/15526 [2:09:23<2:38:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6985/15526 [2:09:23<2:38:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6986/15526 [2:09:24<2:38:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6986/15526 [2:09:24<2:38:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6987/15526 [2:09:25<2:38:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6987/15526 [2:09:25<2:38:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6988/15526 [2:09:26<2:38:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6988/15526 [2:09:26<2:38:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6989/15526 [2:09:26<2:38:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6989/15526 [2:09:26<2:38:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6990/15526 [2:09:27<2:38:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6990/15526 [2:09:27<2:38:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6991/15526 [2:09:28<2:38:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6991/15526 [2:09:28<2:38:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6992/15526 [2:09:28<2:38:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6992/15526 [2:09:28<2:38:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6993/15526 [2:09:29<2:38:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6993/15526 [2:09:29<2:38:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6994/15526 [2:09:30<2:37:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6994/15526 [2:09:30<2:37:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6995/15526 [2:09:30<2:37:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6995/15526 [2:09:30<2:37:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6996/15526 [2:09:31<2:37:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6996/15526 [2:09:31<2:37:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6997/15526 [2:09:32<2:37:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6997/15526 [2:09:32<2:37:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6998/15526 [2:09:32<2:37:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6998/15526 [2:09:32<2:37:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 6999/15526 [2:09:34<2:37:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 6999/15526 [2:09:34<2:37:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7000/15526 [2:09:34<2:37:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7000/15526 [2:09:34<2:37:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7001/15526 [2:09:35<2:37:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7001/15526 [2:09:35<2:37:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7002/15526 [2:09:36<2:37:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7002/15526 [2:09:36<2:37:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7003/15526 [2:09:37<2:37:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7003/15526 [2:09:37<2:37:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7004/15526 [2:09:38<2:37:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7004/15526 [2:09:38<2:37:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7005/15526 [2:09:39<2:37:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7005/15526 [2:09:39<2:37:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7006/15526 [2:09:39<2:37:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7006/15526 [2:09:39<2:37:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7007/15526 [2:09:40<2:37:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7007/15526 [2:09:40<2:37:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7008/15526 [2:09:50<2:37:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7008/15526 [2:09:50<2:37:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7009/15526 [2:09:51<2:37:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7009/15526 [2:09:51<2:37:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7010/15526 [2:09:51<2:37:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7010/15526 [2:09:51<2:37:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7011/15526 [2:09:52<2:37:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7011/15526 [2:09:52<2:37:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7012/15526 [2:09:53<2:37:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7012/15526 [2:09:53<2:37:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7013/15526 [2:09:54<2:37:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7013/15526 [2:09:54<2:37:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7014/15526 [2:09:54<2:37:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7014/15526 [2:09:54<2:37:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7015/15526 [2:09:55<2:37:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7015/15526 [2:09:55<2:37:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7016/15526 [2:09:56<2:37:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7016/15526 [2:09:56<2:37:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7017/15526 [2:09:57<2:37:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7017/15526 [2:09:57<2:37:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7018/15526 [2:09:58<2:37:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7018/15526 [2:09:58<2:37:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7019/15526 [2:09:58<2:37:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7019/15526 [2:09:58<2:37:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7020/15526 [2:09:59<2:37:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7020/15526 [2:09:59<2:37:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7021/15526 [2:10:00<2:37:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7021/15526 [2:10:00<2:37:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7022/15526 [2:10:01<2:37:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7022/15526 [2:10:01<2:37:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7023/15526 [2:10:02<2:37:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7023/15526 [2:10:02<2:37:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7024/15526 [2:10:02<2:37:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7024/15526 [2:10:02<2:37:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7025/15526 [2:10:04<2:37:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7025/15526 [2:10:04<2:37:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7026/15526 [2:10:04<2:37:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7026/15526 [2:10:04<2:37:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7027/15526 [2:10:06<2:37:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7027/15526 [2:10:06<2:37:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7028/15526 [2:10:06<2:37:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7028/15526 [2:10:06<2:37:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7029/15526 [2:10:07<2:37:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7029/15526 [2:10:07<2:37:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7030/15526 [2:10:08<2:37:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7030/15526 [2:10:08<2:37:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7031/15526 [2:10:09<2:37:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7031/15526 [2:10:09<2:37:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7032/15526 [2:10:09<2:37:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7032/15526 [2:10:09<2:37:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7033/15526 [2:10:10<2:37:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7033/15526 [2:10:10<2:37:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7034/15526 [2:10:11<2:37:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7034/15526 [2:10:11<2:37:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7035/15526 [2:10:12<2:37:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7035/15526 [2:10:12<2:37:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7036/15526 [2:10:13<2:37:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7036/15526 [2:10:13<2:37:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7037/15526 [2:10:14<2:37:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7037/15526 [2:10:14<2:37:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7038/15526 [2:10:15<2:37:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7038/15526 [2:10:15<2:37:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7039/15526 [2:10:16<2:37:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7039/15526 [2:10:16<2:37:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7040/15526 [2:10:24<2:37:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7040/15526 [2:10:24<2:37:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7041/15526 [2:10:24<2:37:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7041/15526 [2:10:24<2:37:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7042/15526 [2:10:25<2:37:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7042/15526 [2:10:25<2:37:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7043/15526 [2:10:26<2:37:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7043/15526 [2:10:26<2:37:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7044/15526 [2:10:27<2:37:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7044/15526 [2:10:27<2:37:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7045/15526 [2:10:28<2:37:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7045/15526 [2:10:28<2:37:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7046/15526 [2:10:29<2:37:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7046/15526 [2:10:29<2:37:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7047/15526 [2:10:29<2:37:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7047/15526 [2:10:29<2:37:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7048/15526 [2:10:30<2:36:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7048/15526 [2:10:30<2:36:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7049/15526 [2:10:31<2:36:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7049/15526 [2:10:31<2:36:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7050/15526 [2:10:32<2:36:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7050/15526 [2:10:32<2:36:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7051/15526 [2:10:33<2:36:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7051/15526 [2:10:33<2:36:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7052/15526 [2:10:34<2:36:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7052/15526 [2:10:34<2:36:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7053/15526 [2:10:34<2:36:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7053/15526 [2:10:34<2:36:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7054/15526 [2:10:36<2:36:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7054/15526 [2:10:36<2:36:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7055/15526 [2:10:37<2:36:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7055/15526 [2:10:37<2:36:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7056/15526 [2:10:37<2:36:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7056/15526 [2:10:37<2:36:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7057/15526 [2:10:38<2:36:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7057/15526 [2:10:38<2:36:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7058/15526 [2:10:39<2:36:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7058/15526 [2:10:39<2:36:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7059/15526 [2:10:39<2:36:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7059/15526 [2:10:39<2:36:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7060/15526 [2:10:40<2:36:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7060/15526 [2:10:40<2:36:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7061/15526 [2:10:41<2:36:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7061/15526 [2:10:41<2:36:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7062/15526 [2:10:42<2:36:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7062/15526 [2:10:42<2:36:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7063/15526 [2:10:43<2:36:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7063/15526 [2:10:43<2:36:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 7064/15526 [2:10:44<2:36:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  45%|▍| 7064/15526 [2:10:44<2:36:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7065/15526 [2:10:44<2:36:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7065/15526 [2:10:44<2:36:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7066/15526 [2:10:45<2:36:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7066/15526 [2:10:45<2:36:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7067/15526 [2:10:46<2:36:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7067/15526 [2:10:46<2:36:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7068/15526 [2:10:46<2:36:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7068/15526 [2:10:46<2:36:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7069/15526 [2:10:47<2:36:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7069/15526 [2:10:47<2:36:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7070/15526 [2:10:48<2:36:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7070/15526 [2:10:48<2:36:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7071/15526 [2:10:49<2:36:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7071/15526 [2:10:49<2:36:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7072/15526 [2:10:57<2:36:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7072/15526 [2:10:57<2:36:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7073/15526 [2:10:57<2:36:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7073/15526 [2:10:57<2:36:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7074/15526 [2:10:58<2:36:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7074/15526 [2:10:58<2:36:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7075/15526 [2:10:59<2:36:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7075/15526 [2:10:59<2:36:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7076/15526 [2:10:59<2:36:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7076/15526 [2:10:59<2:36:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7077/15526 [2:11:00<2:36:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7077/15526 [2:11:00<2:36:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7078/15526 [2:11:01<2:36:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7078/15526 [2:11:01<2:36:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7079/15526 [2:11:02<2:36:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7079/15526 [2:11:02<2:36:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7080/15526 [2:11:03<2:36:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7080/15526 [2:11:03<2:36:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7081/15526 [2:11:04<2:36:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7081/15526 [2:11:04<2:36:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7082/15526 [2:11:04<2:36:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7082/15526 [2:11:04<2:36:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7083/15526 [2:11:06<2:36:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7083/15526 [2:11:06<2:36:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7084/15526 [2:11:07<2:36:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7084/15526 [2:11:07<2:36:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7085/15526 [2:11:07<2:36:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7085/15526 [2:11:07<2:36:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7086/15526 [2:11:08<2:36:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7086/15526 [2:11:08<2:36:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7087/15526 [2:11:09<2:36:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7087/15526 [2:11:09<2:36:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7088/15526 [2:11:09<2:36:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7088/15526 [2:11:09<2:36:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7089/15526 [2:11:10<2:36:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7089/15526 [2:11:10<2:36:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7090/15526 [2:11:11<2:36:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7090/15526 [2:11:11<2:36:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7091/15526 [2:11:12<2:36:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7091/15526 [2:11:12<2:36:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7092/15526 [2:11:13<2:36:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7092/15526 [2:11:13<2:36:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7093/15526 [2:11:14<2:36:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7093/15526 [2:11:14<2:36:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7094/15526 [2:11:15<2:36:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7094/15526 [2:11:15<2:36:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7095/15526 [2:11:16<2:35:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7095/15526 [2:11:16<2:35:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7096/15526 [2:11:17<2:35:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7096/15526 [2:11:17<2:35:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7097/15526 [2:11:17<2:35:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7097/15526 [2:11:17<2:35:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7098/15526 [2:11:18<2:35:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7098/15526 [2:11:18<2:35:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7099/15526 [2:11:20<2:35:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7099/15526 [2:11:20<2:35:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7100/15526 [2:11:21<2:35:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7100/15526 [2:11:21<2:35:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7101/15526 [2:11:22<2:35:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7101/15526 [2:11:22<2:35:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7102/15526 [2:11:23<2:35:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7102/15526 [2:11:23<2:35:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7103/15526 [2:11:24<2:35:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7103/15526 [2:11:24<2:35:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7104/15526 [2:11:30<2:35:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7104/15526 [2:11:30<2:35:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7105/15526 [2:11:31<2:35:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7105/15526 [2:11:31<2:35:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7106/15526 [2:11:31<2:35:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7106/15526 [2:11:31<2:35:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7107/15526 [2:11:32<2:35:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7107/15526 [2:11:32<2:35:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7108/15526 [2:11:33<2:35:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7108/15526 [2:11:33<2:35:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7109/15526 [2:11:34<2:35:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7109/15526 [2:11:34<2:35:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7110/15526 [2:11:35<2:35:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7110/15526 [2:11:35<2:35:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7111/15526 [2:11:35<2:35:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7111/15526 [2:11:35<2:35:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7112/15526 [2:11:36<2:35:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7112/15526 [2:11:36<2:35:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7113/15526 [2:11:37<2:35:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7113/15526 [2:11:37<2:35:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7114/15526 [2:11:38<2:35:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7114/15526 [2:11:38<2:35:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7115/15526 [2:11:38<2:35:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7115/15526 [2:11:38<2:35:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7116/15526 [2:11:39<2:35:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7116/15526 [2:11:39<2:35:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7117/15526 [2:11:40<2:35:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7117/15526 [2:11:40<2:35:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7118/15526 [2:11:40<2:35:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7118/15526 [2:11:40<2:35:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7119/15526 [2:11:42<2:35:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7119/15526 [2:11:42<2:35:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7120/15526 [2:11:42<2:35:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7120/15526 [2:11:42<2:35:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7121/15526 [2:11:43<2:35:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7121/15526 [2:11:43<2:35:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7122/15526 [2:11:44<2:35:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7122/15526 [2:11:44<2:35:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7123/15526 [2:11:45<2:35:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7123/15526 [2:11:45<2:35:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7124/15526 [2:11:46<2:35:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7124/15526 [2:11:46<2:35:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7125/15526 [2:11:47<2:35:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7125/15526 [2:11:47<2:35:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7126/15526 [2:11:49<2:35:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7126/15526 [2:11:49<2:35:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7127/15526 [2:11:49<2:35:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7127/15526 [2:11:49<2:35:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7128/15526 [2:11:50<2:35:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7128/15526 [2:11:50<2:35:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7129/15526 [2:11:51<2:35:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7129/15526 [2:11:51<2:35:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7130/15526 [2:11:51<2:35:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7130/15526 [2:11:51<2:35:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7131/15526 [2:11:52<2:35:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7131/15526 [2:11:52<2:35:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7132/15526 [2:11:53<2:35:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7132/15526 [2:11:53<2:35:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7133/15526 [2:11:54<2:35:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7133/15526 [2:11:54<2:35:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7134/15526 [2:11:55<2:35:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7134/15526 [2:11:55<2:35:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7135/15526 [2:11:56<2:35:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7135/15526 [2:11:56<2:35:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7136/15526 [2:12:04<2:35:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7136/15526 [2:12:04<2:35:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7137/15526 [2:12:05<2:35:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7137/15526 [2:12:05<2:35:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7138/15526 [2:12:06<2:35:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7138/15526 [2:12:06<2:35:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7139/15526 [2:12:08<2:35:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7139/15526 [2:12:08<2:35:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7140/15526 [2:12:09<2:35:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7140/15526 [2:12:09<2:35:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7141/15526 [2:12:10<2:35:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7141/15526 [2:12:10<2:35:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7142/15526 [2:12:11<2:35:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7142/15526 [2:12:11<2:35:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7143/15526 [2:12:12<2:35:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7143/15526 [2:12:12<2:35:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7144/15526 [2:12:13<2:35:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7144/15526 [2:12:13<2:35:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7145/15526 [2:12:14<2:35:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7145/15526 [2:12:14<2:35:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7146/15526 [2:12:15<2:35:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7146/15526 [2:12:15<2:35:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7147/15526 [2:12:16<2:35:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7147/15526 [2:12:16<2:35:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7148/15526 [2:12:17<2:35:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7148/15526 [2:12:17<2:35:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7149/15526 [2:12:18<2:35:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7149/15526 [2:12:18<2:35:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7150/15526 [2:12:18<2:35:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7150/15526 [2:12:18<2:35:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7151/15526 [2:12:19<2:34:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7151/15526 [2:12:19<2:34:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7152/15526 [2:12:20<2:34:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7152/15526 [2:12:20<2:34:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7153/15526 [2:12:21<2:34:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7153/15526 [2:12:21<2:34:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7154/15526 [2:12:22<2:34:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7154/15526 [2:12:22<2:34:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7155/15526 [2:12:22<2:34:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7155/15526 [2:12:22<2:34:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7156/15526 [2:12:23<2:34:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7156/15526 [2:12:23<2:34:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7157/15526 [2:12:24<2:34:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7157/15526 [2:12:24<2:34:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7158/15526 [2:12:24<2:34:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7158/15526 [2:12:24<2:34:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7159/15526 [2:12:25<2:34:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7159/15526 [2:12:25<2:34:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7160/15526 [2:12:27<2:34:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7160/15526 [2:12:27<2:34:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7161/15526 [2:12:27<2:34:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7161/15526 [2:12:27<2:34:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7162/15526 [2:12:28<2:34:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7162/15526 [2:12:28<2:34:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7163/15526 [2:12:29<2:34:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7163/15526 [2:12:29<2:34:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7164/15526 [2:12:29<2:34:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7164/15526 [2:12:29<2:34:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7165/15526 [2:12:30<2:34:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7165/15526 [2:12:30<2:34:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7166/15526 [2:12:31<2:34:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7166/15526 [2:12:31<2:34:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7167/15526 [2:12:31<2:34:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7167/15526 [2:12:31<2:34:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7168/15526 [2:12:41<2:34:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7168/15526 [2:12:41<2:34:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7169/15526 [2:12:41<2:34:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7169/15526 [2:12:41<2:34:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7170/15526 [2:12:42<2:34:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7170/15526 [2:12:42<2:34:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7171/15526 [2:12:43<2:34:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7171/15526 [2:12:43<2:34:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7172/15526 [2:12:44<2:34:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7172/15526 [2:12:44<2:34:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7173/15526 [2:12:44<2:34:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7173/15526 [2:12:44<2:34:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7174/15526 [2:12:45<2:34:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7174/15526 [2:12:45<2:34:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7175/15526 [2:12:46<2:34:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7175/15526 [2:12:46<2:34:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7176/15526 [2:12:47<2:34:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7176/15526 [2:12:47<2:34:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7177/15526 [2:12:48<2:34:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7177/15526 [2:12:48<2:34:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7178/15526 [2:12:48<2:34:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7178/15526 [2:12:48<2:34:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7179/15526 [2:12:49<2:34:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7179/15526 [2:12:49<2:34:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7180/15526 [2:12:50<2:34:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7180/15526 [2:12:50<2:34:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7181/15526 [2:12:50<2:34:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7181/15526 [2:12:50<2:34:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7182/15526 [2:12:51<2:34:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7182/15526 [2:12:51<2:34:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7183/15526 [2:12:52<2:34:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7183/15526 [2:12:52<2:34:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7184/15526 [2:12:53<2:34:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7184/15526 [2:12:53<2:34:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7185/15526 [2:12:54<2:34:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7185/15526 [2:12:54<2:34:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7186/15526 [2:12:54<2:34:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7186/15526 [2:12:54<2:34:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7187/15526 [2:12:55<2:34:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7187/15526 [2:12:55<2:34:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7188/15526 [2:12:56<2:34:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7188/15526 [2:12:56<2:34:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7189/15526 [2:12:57<2:34:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7189/15526 [2:12:57<2:34:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7190/15526 [2:12:57<2:34:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7190/15526 [2:12:57<2:34:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7191/15526 [2:12:59<2:34:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7191/15526 [2:12:59<2:34:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7192/15526 [2:13:00<2:34:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7192/15526 [2:13:00<2:34:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7193/15526 [2:13:00<2:34:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7193/15526 [2:13:00<2:34:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7194/15526 [2:13:01<2:34:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7194/15526 [2:13:01<2:34:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7195/15526 [2:13:02<2:34:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7195/15526 [2:13:02<2:34:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7196/15526 [2:13:03<2:34:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7196/15526 [2:13:03<2:34:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7197/15526 [2:13:04<2:33:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7197/15526 [2:13:04<2:33:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7198/15526 [2:13:05<2:33:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7198/15526 [2:13:05<2:33:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7199/15526 [2:13:05<2:33:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7199/15526 [2:13:05<2:33:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7200/15526 [2:13:15<2:34:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7200/15526 [2:13:15<2:34:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7201/15526 [2:13:39<2:34:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7201/15526 [2:13:39<2:34:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7202/15526 [2:13:41<2:34:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7202/15526 [2:13:41<2:34:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7203/15526 [2:13:41<2:34:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7203/15526 [2:13:41<2:34:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7204/15526 [2:13:42<2:34:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7204/15526 [2:13:42<2:34:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7205/15526 [2:13:43<2:34:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7205/15526 [2:13:43<2:34:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7206/15526 [2:13:43<2:34:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7206/15526 [2:13:43<2:34:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7207/15526 [2:13:44<2:34:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7207/15526 [2:13:44<2:34:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7208/15526 [2:13:45<2:34:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7208/15526 [2:13:45<2:34:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7209/15526 [2:13:45<2:34:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7209/15526 [2:13:45<2:34:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7210/15526 [2:13:46<2:34:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7210/15526 [2:13:46<2:34:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7211/15526 [2:13:47<2:34:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7211/15526 [2:13:47<2:34:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7212/15526 [2:13:48<2:34:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7212/15526 [2:13:48<2:34:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7213/15526 [2:13:49<2:34:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7213/15526 [2:13:49<2:34:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7214/15526 [2:13:50<2:34:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7214/15526 [2:13:50<2:34:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7215/15526 [2:13:50<2:34:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7215/15526 [2:13:50<2:34:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7216/15526 [2:13:52<2:34:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7216/15526 [2:13:52<2:34:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7217/15526 [2:13:52<2:34:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7217/15526 [2:13:52<2:34:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7218/15526 [2:13:53<2:34:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7218/15526 [2:13:53<2:34:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 7219/15526 [2:13:54<2:34:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  46%|▍| 7219/15526 [2:13:54<2:34:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7220/15526 [2:13:54<2:34:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7220/15526 [2:13:54<2:34:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7221/15526 [2:13:55<2:34:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7221/15526 [2:13:55<2:34:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7222/15526 [2:13:56<2:34:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7222/15526 [2:13:56<2:34:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7223/15526 [2:13:57<2:33:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7223/15526 [2:13:57<2:33:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7224/15526 [2:13:58<2:33:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7224/15526 [2:13:58<2:33:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7225/15526 [2:13:59<2:33:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7225/15526 [2:13:59<2:33:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7226/15526 [2:13:59<2:33:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7226/15526 [2:13:59<2:33:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7227/15526 [2:14:00<2:33:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7227/15526 [2:14:00<2:33:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7228/15526 [2:14:01<2:33:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7228/15526 [2:14:01<2:33:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7229/15526 [2:14:02<2:33:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7229/15526 [2:14:02<2:33:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7230/15526 [2:14:03<2:33:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7230/15526 [2:14:03<2:33:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7231/15526 [2:14:04<2:33:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7231/15526 [2:14:04<2:33:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7232/15526 [2:14:14<2:33:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7232/15526 [2:14:14<2:33:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7233/15526 [2:14:15<2:33:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7233/15526 [2:14:15<2:33:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7234/15526 [2:14:15<2:33:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7234/15526 [2:14:15<2:33:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7235/15526 [2:14:16<2:33:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7235/15526 [2:14:16<2:33:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7236/15526 [2:14:17<2:33:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7236/15526 [2:14:17<2:33:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7237/15526 [2:14:18<2:33:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7237/15526 [2:14:18<2:33:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7238/15526 [2:14:19<2:33:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7238/15526 [2:14:19<2:33:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7239/15526 [2:14:20<2:33:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7239/15526 [2:14:20<2:33:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7240/15526 [2:14:21<2:33:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7240/15526 [2:14:21<2:33:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7241/15526 [2:14:22<2:33:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7241/15526 [2:14:22<2:33:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7242/15526 [2:14:23<2:33:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7242/15526 [2:14:23<2:33:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7243/15526 [2:14:24<2:33:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7243/15526 [2:14:24<2:33:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7244/15526 [2:14:24<2:33:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7244/15526 [2:14:24<2:33:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7245/15526 [2:14:26<2:33:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7245/15526 [2:14:26<2:33:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7246/15526 [2:14:27<2:33:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7246/15526 [2:14:27<2:33:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7247/15526 [2:14:28<2:33:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7247/15526 [2:14:28<2:33:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7248/15526 [2:14:29<2:33:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7248/15526 [2:14:29<2:33:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7249/15526 [2:14:29<2:33:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7249/15526 [2:14:29<2:33:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7250/15526 [2:14:30<2:33:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7250/15526 [2:14:30<2:33:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7251/15526 [2:14:31<2:33:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7251/15526 [2:14:31<2:33:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7252/15526 [2:14:33<2:33:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7252/15526 [2:14:33<2:33:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7253/15526 [2:14:33<2:33:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7253/15526 [2:14:33<2:33:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7254/15526 [2:14:34<2:33:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7254/15526 [2:14:34<2:33:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7255/15526 [2:14:35<2:33:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7255/15526 [2:14:35<2:33:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7256/15526 [2:14:36<2:33:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7256/15526 [2:14:36<2:33:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7257/15526 [2:14:37<2:33:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7257/15526 [2:14:37<2:33:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7258/15526 [2:14:38<2:33:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7258/15526 [2:14:38<2:33:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7259/15526 [2:14:39<2:33:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7259/15526 [2:14:39<2:33:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7260/15526 [2:14:40<2:33:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7260/15526 [2:14:40<2:33:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7261/15526 [2:14:41<2:33:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7261/15526 [2:14:41<2:33:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7262/15526 [2:14:42<2:33:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7262/15526 [2:14:42<2:33:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7263/15526 [2:14:42<2:33:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7263/15526 [2:14:42<2:33:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7264/15526 [2:14:48<2:33:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7264/15526 [2:14:48<2:33:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7265/15526 [2:14:49<2:33:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7265/15526 [2:14:49<2:33:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7266/15526 [2:14:51<2:33:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7266/15526 [2:14:51<2:33:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7267/15526 [2:14:52<2:33:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7267/15526 [2:14:52<2:33:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7268/15526 [2:14:53<2:33:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7268/15526 [2:14:53<2:33:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7269/15526 [2:14:54<2:33:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7269/15526 [2:14:54<2:33:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7270/15526 [2:14:54<2:33:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7270/15526 [2:14:54<2:33:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7271/15526 [2:14:55<2:33:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7271/15526 [2:14:55<2:33:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7272/15526 [2:14:56<2:33:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7272/15526 [2:14:56<2:33:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7273/15526 [2:14:56<2:33:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7273/15526 [2:14:56<2:33:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7274/15526 [2:14:57<2:33:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7274/15526 [2:14:57<2:33:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7275/15526 [2:14:58<2:33:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7275/15526 [2:14:58<2:33:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7276/15526 [2:14:58<2:33:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7276/15526 [2:14:58<2:33:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7277/15526 [2:14:59<2:33:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7277/15526 [2:14:59<2:33:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7278/15526 [2:15:00<2:32:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7278/15526 [2:15:00<2:32:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7279/15526 [2:15:00<2:32:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7279/15526 [2:15:00<2:32:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7280/15526 [2:15:02<2:32:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7280/15526 [2:15:02<2:32:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7281/15526 [2:15:03<2:32:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7281/15526 [2:15:03<2:32:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7282/15526 [2:15:04<2:32:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7282/15526 [2:15:04<2:32:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7283/15526 [2:15:05<2:32:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7283/15526 [2:15:05<2:32:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7284/15526 [2:15:05<2:32:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7284/15526 [2:15:05<2:32:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7285/15526 [2:15:06<2:32:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7285/15526 [2:15:06<2:32:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7286/15526 [2:15:07<2:32:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7286/15526 [2:15:07<2:32:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7287/15526 [2:15:07<2:32:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7287/15526 [2:15:07<2:32:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7288/15526 [2:15:08<2:32:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7288/15526 [2:15:08<2:32:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7289/15526 [2:15:09<2:32:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7289/15526 [2:15:09<2:32:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7290/15526 [2:15:10<2:32:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7290/15526 [2:15:10<2:32:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7291/15526 [2:15:11<2:32:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7291/15526 [2:15:11<2:32:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7292/15526 [2:15:11<2:32:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7292/15526 [2:15:11<2:32:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7293/15526 [2:15:13<2:32:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7293/15526 [2:15:13<2:32:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7294/15526 [2:15:13<2:32:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7294/15526 [2:15:13<2:32:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7295/15526 [2:15:14<2:32:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7295/15526 [2:15:14<2:32:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7296/15526 [2:15:23<2:32:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7296/15526 [2:15:23<2:32:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7297/15526 [2:15:23<2:32:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7297/15526 [2:15:23<2:32:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7298/15526 [2:15:24<2:32:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7298/15526 [2:15:24<2:32:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7299/15526 [2:15:25<2:32:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7299/15526 [2:15:25<2:32:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7300/15526 [2:15:25<2:32:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7300/15526 [2:15:25<2:32:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7301/15526 [2:15:26<2:32:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7301/15526 [2:15:26<2:32:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7302/15526 [2:15:27<2:32:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7302/15526 [2:15:27<2:32:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7303/15526 [2:15:28<2:32:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7303/15526 [2:15:28<2:32:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7304/15526 [2:15:30<2:32:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7304/15526 [2:15:30<2:32:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7305/15526 [2:15:31<2:32:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7305/15526 [2:15:31<2:32:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7306/15526 [2:15:31<2:32:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7306/15526 [2:15:31<2:32:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7307/15526 [2:15:32<2:32:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7307/15526 [2:15:32<2:32:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7308/15526 [2:15:33<2:32:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7308/15526 [2:15:33<2:32:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7309/15526 [2:15:33<2:32:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7309/15526 [2:15:33<2:32:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7310/15526 [2:15:35<2:32:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7310/15526 [2:15:35<2:32:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7311/15526 [2:15:36<2:32:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7311/15526 [2:15:36<2:32:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7312/15526 [2:15:37<2:32:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7312/15526 [2:15:37<2:32:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7313/15526 [2:15:38<2:32:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7313/15526 [2:15:38<2:32:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7314/15526 [2:15:39<2:32:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7314/15526 [2:15:39<2:32:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7315/15526 [2:15:40<2:32:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7315/15526 [2:15:40<2:32:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7316/15526 [2:15:41<2:32:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7316/15526 [2:15:41<2:32:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7317/15526 [2:15:42<2:32:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7317/15526 [2:15:42<2:32:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7318/15526 [2:15:43<2:32:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7318/15526 [2:15:43<2:32:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7319/15526 [2:15:44<2:32:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7319/15526 [2:15:44<2:32:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7320/15526 [2:15:44<2:32:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7320/15526 [2:15:44<2:32:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7321/15526 [2:15:45<2:32:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7321/15526 [2:15:45<2:32:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7322/15526 [2:15:46<2:32:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7322/15526 [2:15:46<2:32:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7323/15526 [2:15:47<2:32:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7323/15526 [2:15:47<2:32:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7324/15526 [2:15:48<2:32:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7324/15526 [2:15:48<2:32:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7325/15526 [2:15:49<2:32:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7325/15526 [2:15:49<2:32:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7326/15526 [2:15:50<2:32:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7326/15526 [2:15:50<2:32:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7327/15526 [2:15:50<2:32:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7327/15526 [2:15:50<2:32:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7328/15526 [2:15:58<2:32:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7328/15526 [2:15:58<2:32:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7329/15526 [2:15:59<2:32:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7329/15526 [2:15:59<2:32:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7330/15526 [2:16:00<2:32:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7330/15526 [2:16:00<2:32:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7331/15526 [2:16:01<2:32:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7331/15526 [2:16:01<2:32:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7332/15526 [2:16:02<2:32:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7332/15526 [2:16:02<2:32:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7333/15526 [2:16:03<2:32:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7333/15526 [2:16:03<2:32:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7334/15526 [2:16:03<2:31:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7334/15526 [2:16:03<2:31:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7335/15526 [2:16:05<2:31:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7335/15526 [2:16:05<2:31:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7336/15526 [2:16:05<2:31:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7336/15526 [2:16:05<2:31:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7337/15526 [2:16:06<2:31:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7337/15526 [2:16:06<2:31:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7338/15526 [2:16:07<2:31:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7338/15526 [2:16:07<2:31:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7339/15526 [2:16:07<2:31:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7339/15526 [2:16:07<2:31:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7340/15526 [2:16:08<2:31:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7340/15526 [2:16:08<2:31:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7341/15526 [2:16:09<2:31:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7341/15526 [2:16:09<2:31:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7342/15526 [2:16:10<2:31:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7342/15526 [2:16:10<2:31:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7343/15526 [2:16:10<2:31:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7343/15526 [2:16:10<2:31:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7344/15526 [2:16:11<2:31:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7344/15526 [2:16:11<2:31:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7345/15526 [2:16:12<2:31:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7345/15526 [2:16:12<2:31:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7346/15526 [2:16:13<2:31:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7346/15526 [2:16:13<2:31:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7347/15526 [2:16:14<2:31:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7347/15526 [2:16:14<2:31:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7348/15526 [2:16:15<2:31:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7348/15526 [2:16:15<2:31:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7349/15526 [2:16:16<2:31:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7349/15526 [2:16:16<2:31:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7350/15526 [2:16:17<2:31:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7350/15526 [2:16:17<2:31:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7351/15526 [2:16:18<2:31:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7351/15526 [2:16:18<2:31:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7352/15526 [2:16:19<2:31:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7352/15526 [2:16:19<2:31:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7353/15526 [2:16:20<2:31:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7353/15526 [2:16:20<2:31:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7354/15526 [2:16:20<2:31:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7354/15526 [2:16:20<2:31:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7355/15526 [2:16:21<2:31:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7355/15526 [2:16:21<2:31:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7356/15526 [2:16:22<2:31:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7356/15526 [2:16:22<2:31:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7357/15526 [2:16:23<2:31:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7357/15526 [2:16:23<2:31:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7358/15526 [2:16:24<2:31:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7358/15526 [2:16:24<2:31:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7359/15526 [2:16:25<2:31:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7359/15526 [2:16:25<2:31:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7360/15526 [2:16:32<2:31:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7360/15526 [2:16:32<2:31:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7361/15526 [2:16:32<2:31:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7361/15526 [2:16:32<2:31:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7362/15526 [2:16:33<2:31:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7362/15526 [2:16:33<2:31:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7363/15526 [2:16:34<2:31:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7363/15526 [2:16:34<2:31:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7364/15526 [2:16:35<2:31:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7364/15526 [2:16:35<2:31:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7365/15526 [2:16:36<2:31:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7365/15526 [2:16:36<2:31:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7366/15526 [2:16:37<2:31:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7366/15526 [2:16:37<2:31:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7367/15526 [2:16:38<2:31:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7367/15526 [2:16:38<2:31:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7368/15526 [2:16:39<2:31:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7368/15526 [2:16:39<2:31:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7369/15526 [2:16:40<2:31:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7369/15526 [2:16:40<2:31:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7370/15526 [2:16:40<2:31:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7370/15526 [2:16:40<2:31:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7371/15526 [2:16:42<2:31:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7371/15526 [2:16:42<2:31:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7372/15526 [2:16:42<2:31:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7372/15526 [2:16:42<2:31:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7373/15526 [2:16:44<2:31:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7373/15526 [2:16:44<2:31:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 7374/15526 [2:16:45<2:31:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  47%|▍| 7374/15526 [2:16:45<2:31:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7375/15526 [2:16:46<2:31:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7375/15526 [2:16:46<2:31:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7376/15526 [2:16:47<2:31:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7376/15526 [2:16:47<2:31:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7377/15526 [2:16:47<2:31:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7377/15526 [2:16:47<2:31:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7378/15526 [2:16:48<2:31:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7378/15526 [2:16:48<2:31:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7379/15526 [2:16:49<2:31:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7379/15526 [2:16:49<2:31:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7380/15526 [2:16:50<2:31:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7380/15526 [2:16:50<2:31:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7381/15526 [2:16:51<2:31:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7381/15526 [2:16:51<2:31:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7382/15526 [2:16:52<2:31:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7382/15526 [2:16:52<2:31:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7383/15526 [2:16:53<2:30:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7383/15526 [2:16:53<2:30:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7384/15526 [2:16:54<2:30:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7384/15526 [2:16:54<2:30:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7385/15526 [2:16:54<2:30:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7385/15526 [2:16:54<2:30:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7386/15526 [2:16:55<2:30:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7386/15526 [2:16:55<2:30:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7387/15526 [2:16:56<2:30:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7387/15526 [2:16:56<2:30:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7388/15526 [2:16:57<2:30:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7388/15526 [2:16:57<2:30:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7389/15526 [2:16:58<2:30:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7389/15526 [2:16:58<2:30:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7390/15526 [2:16:58<2:30:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7390/15526 [2:16:58<2:30:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7391/15526 [2:16:59<2:30:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7391/15526 [2:16:59<2:30:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7392/15526 [2:17:06<2:30:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7392/15526 [2:17:06<2:30:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7393/15526 [2:17:07<2:30:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7393/15526 [2:17:07<2:30:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7394/15526 [2:17:08<2:30:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7394/15526 [2:17:08<2:30:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7395/15526 [2:17:09<2:30:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7395/15526 [2:17:09<2:30:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7396/15526 [2:17:09<2:30:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7396/15526 [2:17:09<2:30:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7397/15526 [2:17:10<2:30:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7397/15526 [2:17:10<2:30:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7398/15526 [2:17:11<2:30:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7398/15526 [2:17:11<2:30:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7399/15526 [2:17:11<2:30:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7399/15526 [2:17:11<2:30:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7400/15526 [2:17:12<2:30:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7400/15526 [2:17:12<2:30:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7401/15526 [2:17:13<2:30:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7401/15526 [2:17:13<2:30:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7402/15526 [2:17:14<2:30:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7402/15526 [2:17:14<2:30:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7403/15526 [2:17:15<2:30:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7403/15526 [2:17:15<2:30:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7404/15526 [2:17:15<2:30:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7404/15526 [2:17:15<2:30:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7405/15526 [2:17:16<2:30:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7405/15526 [2:17:16<2:30:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7406/15526 [2:17:17<2:30:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7406/15526 [2:17:17<2:30:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7407/15526 [2:17:18<2:30:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7407/15526 [2:17:18<2:30:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7408/15526 [2:17:19<2:30:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7408/15526 [2:17:19<2:30:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7409/15526 [2:17:19<2:30:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7409/15526 [2:17:19<2:30:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7410/15526 [2:17:20<2:30:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7410/15526 [2:17:20<2:30:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7411/15526 [2:17:21<2:30:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7411/15526 [2:17:21<2:30:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7412/15526 [2:17:21<2:30:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7412/15526 [2:17:21<2:30:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7413/15526 [2:17:22<2:30:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7413/15526 [2:17:22<2:30:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7414/15526 [2:17:23<2:30:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7414/15526 [2:17:23<2:30:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7415/15526 [2:17:24<2:30:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7415/15526 [2:17:24<2:30:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7416/15526 [2:17:25<2:30:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7416/15526 [2:17:25<2:30:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7417/15526 [2:17:26<2:30:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7417/15526 [2:17:26<2:30:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7418/15526 [2:17:27<2:30:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7418/15526 [2:17:27<2:30:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7419/15526 [2:17:27<2:30:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7419/15526 [2:17:27<2:30:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7420/15526 [2:17:28<2:30:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7420/15526 [2:17:28<2:30:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7421/15526 [2:17:29<2:30:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7421/15526 [2:17:29<2:30:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7422/15526 [2:17:30<2:30:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7422/15526 [2:17:30<2:30:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7423/15526 [2:17:31<2:30:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7423/15526 [2:17:31<2:30:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7424/15526 [2:17:39<2:30:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7424/15526 [2:17:39<2:30:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7425/15526 [2:17:40<2:30:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7425/15526 [2:17:40<2:30:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7426/15526 [2:17:41<2:30:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7426/15526 [2:17:41<2:30:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7427/15526 [2:17:41<2:30:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7427/15526 [2:17:41<2:30:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7428/15526 [2:17:43<2:30:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7428/15526 [2:17:43<2:30:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7429/15526 [2:17:43<2:30:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7429/15526 [2:17:43<2:30:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7430/15526 [2:17:44<2:30:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7430/15526 [2:17:44<2:30:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7431/15526 [2:17:45<2:30:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7431/15526 [2:17:45<2:30:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7432/15526 [2:17:45<2:30:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7432/15526 [2:17:45<2:30:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7433/15526 [2:17:47<2:30:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7433/15526 [2:17:47<2:30:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7434/15526 [2:17:47<2:29:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7434/15526 [2:17:47<2:29:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7435/15526 [2:17:49<2:29:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7435/15526 [2:17:49<2:29:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7436/15526 [2:17:50<2:29:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7436/15526 [2:17:50<2:29:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7437/15526 [2:17:51<2:29:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7437/15526 [2:17:51<2:29:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7438/15526 [2:17:52<2:29:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7438/15526 [2:17:52<2:29:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7439/15526 [2:17:52<2:29:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7439/15526 [2:17:52<2:29:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7440/15526 [2:17:53<2:29:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7440/15526 [2:17:53<2:29:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7441/15526 [2:17:54<2:29:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7441/15526 [2:17:54<2:29:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7442/15526 [2:17:55<2:29:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7442/15526 [2:17:55<2:29:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7443/15526 [2:17:56<2:29:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7443/15526 [2:17:56<2:29:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7444/15526 [2:17:57<2:29:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7444/15526 [2:17:57<2:29:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7445/15526 [2:17:58<2:29:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7445/15526 [2:17:58<2:29:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7446/15526 [2:17:59<2:29:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7446/15526 [2:17:59<2:29:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7447/15526 [2:17:59<2:29:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7447/15526 [2:17:59<2:29:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7448/15526 [2:18:00<2:29:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7448/15526 [2:18:00<2:29:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7449/15526 [2:18:01<2:29:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7449/15526 [2:18:01<2:29:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7450/15526 [2:18:02<2:29:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7450/15526 [2:18:02<2:29:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7451/15526 [2:18:03<2:29:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7451/15526 [2:18:03<2:29:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7452/15526 [2:18:03<2:29:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7452/15526 [2:18:03<2:29:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7453/15526 [2:18:04<2:29:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7453/15526 [2:18:04<2:29:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7454/15526 [2:18:05<2:29:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7454/15526 [2:18:05<2:29:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7455/15526 [2:18:06<2:29:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7455/15526 [2:18:06<2:29:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7456/15526 [2:18:14<2:29:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7456/15526 [2:18:14<2:29:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7457/15526 [2:18:15<2:29:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7457/15526 [2:18:15<2:29:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7458/15526 [2:18:16<2:29:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7458/15526 [2:18:16<2:29:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7459/15526 [2:18:17<2:29:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7459/15526 [2:18:17<2:29:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7460/15526 [2:18:17<2:29:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7460/15526 [2:18:17<2:29:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7461/15526 [2:18:19<2:29:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7461/15526 [2:18:19<2:29:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7462/15526 [2:18:19<2:29:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7462/15526 [2:18:19<2:29:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7463/15526 [2:18:20<2:29:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7463/15526 [2:18:20<2:29:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7464/15526 [2:18:21<2:29:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7464/15526 [2:18:21<2:29:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7465/15526 [2:18:22<2:29:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7465/15526 [2:18:22<2:29:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7466/15526 [2:18:23<2:29:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7466/15526 [2:18:23<2:29:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7467/15526 [2:18:24<2:29:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7467/15526 [2:18:24<2:29:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7468/15526 [2:18:25<2:29:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7468/15526 [2:18:25<2:29:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7469/15526 [2:18:26<2:29:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7469/15526 [2:18:26<2:29:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7470/15526 [2:18:27<2:29:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7470/15526 [2:18:27<2:29:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7471/15526 [2:18:27<2:29:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7471/15526 [2:18:28<2:29:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7472/15526 [2:18:28<2:29:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7472/15526 [2:18:28<2:29:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7473/15526 [2:18:29<2:29:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7473/15526 [2:18:29<2:29:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7474/15526 [2:18:29<2:29:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7474/15526 [2:18:29<2:29:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7475/15526 [2:18:30<2:29:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7475/15526 [2:18:30<2:29:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7476/15526 [2:18:31<2:29:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7476/15526 [2:18:31<2:29:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7477/15526 [2:18:32<2:29:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7477/15526 [2:18:32<2:29:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7478/15526 [2:18:33<2:29:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7478/15526 [2:18:33<2:29:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7479/15526 [2:18:33<2:29:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7479/15526 [2:18:33<2:29:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7480/15526 [2:18:34<2:29:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7480/15526 [2:18:34<2:29:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7481/15526 [2:18:35<2:29:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7481/15526 [2:18:35<2:29:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7482/15526 [2:18:36<2:29:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7482/15526 [2:18:36<2:29:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7483/15526 [2:18:37<2:28:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7483/15526 [2:18:37<2:28:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7484/15526 [2:18:38<2:28:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7484/15526 [2:18:38<2:28:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7485/15526 [2:18:38<2:28:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7485/15526 [2:18:38<2:28:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7486/15526 [2:18:39<2:28:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7486/15526 [2:18:39<2:28:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7487/15526 [2:18:40<2:28:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7487/15526 [2:18:40<2:28:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7488/15526 [2:18:47<2:28:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7488/15526 [2:18:47<2:28:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7489/15526 [2:18:48<2:28:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7489/15526 [2:18:48<2:28:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7490/15526 [2:18:49<2:28:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7490/15526 [2:18:49<2:28:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7491/15526 [2:18:49<2:28:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7491/15526 [2:18:49<2:28:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7492/15526 [2:18:50<2:28:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7492/15526 [2:18:50<2:28:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7493/15526 [2:18:51<2:28:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7493/15526 [2:18:51<2:28:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7494/15526 [2:18:52<2:28:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7494/15526 [2:18:52<2:28:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7495/15526 [2:18:52<2:28:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7495/15526 [2:18:52<2:28:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7496/15526 [2:18:53<2:28:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7496/15526 [2:18:53<2:28:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7497/15526 [2:18:54<2:28:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7497/15526 [2:18:54<2:28:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7498/15526 [2:18:55<2:28:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7498/15526 [2:18:55<2:28:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7499/15526 [2:18:56<2:28:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7499/15526 [2:18:56<2:28:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7500/15526 [2:18:57<2:28:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7500/15526 [2:18:57<2:28:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7501/15526 [2:18:57<2:28:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7501/15526 [2:18:57<2:28:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7502/15526 [2:18:58<2:28:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7502/15526 [2:18:58<2:28:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7503/15526 [2:18:59<2:28:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7503/15526 [2:18:59<2:28:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7504/15526 [2:18:59<2:28:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7504/15526 [2:18:59<2:28:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7505/15526 [2:19:00<2:28:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7505/15526 [2:19:00<2:28:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7506/15526 [2:19:01<2:28:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7506/15526 [2:19:01<2:28:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7507/15526 [2:19:02<2:28:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7507/15526 [2:19:02<2:28:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7508/15526 [2:19:03<2:28:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7508/15526 [2:19:03<2:28:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7509/15526 [2:19:03<2:28:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7509/15526 [2:19:03<2:28:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7510/15526 [2:19:04<2:28:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7510/15526 [2:19:04<2:28:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7511/15526 [2:19:05<2:28:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7511/15526 [2:19:05<2:28:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7512/15526 [2:19:06<2:28:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7512/15526 [2:19:06<2:28:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7513/15526 [2:19:07<2:28:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7513/15526 [2:19:07<2:28:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7514/15526 [2:19:08<2:28:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7514/15526 [2:19:08<2:28:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7515/15526 [2:19:09<2:28:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7515/15526 [2:19:09<2:28:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7516/15526 [2:19:09<2:28:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7516/15526 [2:19:09<2:28:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7517/15526 [2:19:10<2:28:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7517/15526 [2:19:10<2:28:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7518/15526 [2:19:11<2:28:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7518/15526 [2:19:11<2:28:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7519/15526 [2:19:11<2:28:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7519/15526 [2:19:11<2:28:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7520/15526 [2:19:21<2:28:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7520/15526 [2:19:21<2:28:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7521/15526 [2:19:22<2:28:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7521/15526 [2:19:22<2:28:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7522/15526 [2:19:23<2:28:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7522/15526 [2:19:23<2:28:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7523/15526 [2:19:24<2:28:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7523/15526 [2:19:24<2:28:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7524/15526 [2:19:26<2:28:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7524/15526 [2:19:26<2:28:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7525/15526 [2:19:26<2:28:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7525/15526 [2:19:26<2:28:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7526/15526 [2:19:28<2:28:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7526/15526 [2:19:28<2:28:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7527/15526 [2:19:28<2:28:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7527/15526 [2:19:28<2:28:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7528/15526 [2:19:29<2:28:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7528/15526 [2:19:29<2:28:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7529/15526 [2:19:30<2:28:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7529/15526 [2:19:30<2:28:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 7530/15526 [2:19:31<2:28:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  48%|▍| 7530/15526 [2:19:31<2:28:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7531/15526 [2:19:32<2:28:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7531/15526 [2:19:32<2:28:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7532/15526 [2:19:32<2:28:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7532/15526 [2:19:32<2:28:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7533/15526 [2:19:33<2:28:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7533/15526 [2:19:33<2:28:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7534/15526 [2:19:34<2:28:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7534/15526 [2:19:34<2:28:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7535/15526 [2:19:34<2:28:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7535/15526 [2:19:34<2:28:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7536/15526 [2:19:35<2:28:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7536/15526 [2:19:35<2:28:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7537/15526 [2:19:36<2:27:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7537/15526 [2:19:36<2:27:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7538/15526 [2:19:36<2:27:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7538/15526 [2:19:36<2:27:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7539/15526 [2:19:37<2:27:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7539/15526 [2:19:37<2:27:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7540/15526 [2:19:38<2:27:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7540/15526 [2:19:38<2:27:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7541/15526 [2:19:39<2:27:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7541/15526 [2:19:39<2:27:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7542/15526 [2:19:40<2:27:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7542/15526 [2:19:40<2:27:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7543/15526 [2:19:40<2:27:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7543/15526 [2:19:40<2:27:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7544/15526 [2:19:41<2:27:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7544/15526 [2:19:41<2:27:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7545/15526 [2:19:42<2:27:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7545/15526 [2:19:42<2:27:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7546/15526 [2:19:43<2:27:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7546/15526 [2:19:43<2:27:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7547/15526 [2:19:44<2:27:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7547/15526 [2:19:44<2:27:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7548/15526 [2:19:45<2:27:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7548/15526 [2:19:45<2:27:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7549/15526 [2:19:46<2:27:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7549/15526 [2:19:46<2:27:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7550/15526 [2:19:47<2:27:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7550/15526 [2:19:47<2:27:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7551/15526 [2:19:48<2:27:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7551/15526 [2:19:48<2:27:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7552/15526 [2:19:55<2:27:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7552/15526 [2:19:55<2:27:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7553/15526 [2:19:56<2:27:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7553/15526 [2:19:56<2:27:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7554/15526 [2:19:56<2:27:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7554/15526 [2:19:56<2:27:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7555/15526 [2:19:58<2:27:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7555/15526 [2:19:58<2:27:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7556/15526 [2:19:58<2:27:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7556/15526 [2:19:58<2:27:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7557/15526 [2:19:59<2:27:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7557/15526 [2:19:59<2:27:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7558/15526 [2:19:59<2:27:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7558/15526 [2:19:59<2:27:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7559/15526 [2:20:01<2:27:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7559/15526 [2:20:01<2:27:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7560/15526 [2:20:01<2:27:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7560/15526 [2:20:01<2:27:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7561/15526 [2:20:02<2:27:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7561/15526 [2:20:02<2:27:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7562/15526 [2:20:03<2:27:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7562/15526 [2:20:03<2:27:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7563/15526 [2:20:03<2:27:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7563/15526 [2:20:03<2:27:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7564/15526 [2:20:04<2:27:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7564/15526 [2:20:04<2:27:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7565/15526 [2:20:05<2:27:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7565/15526 [2:20:05<2:27:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7566/15526 [2:20:06<2:27:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7566/15526 [2:20:06<2:27:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7567/15526 [2:20:08<2:27:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7567/15526 [2:20:08<2:27:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7568/15526 [2:20:09<2:27:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7568/15526 [2:20:09<2:27:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7569/15526 [2:20:10<2:27:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7569/15526 [2:20:10<2:27:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7570/15526 [2:20:11<2:27:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7570/15526 [2:20:11<2:27:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7571/15526 [2:20:11<2:27:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7571/15526 [2:20:11<2:27:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7572/15526 [2:20:12<2:27:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7572/15526 [2:20:12<2:27:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7573/15526 [2:20:14<2:27:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7573/15526 [2:20:14<2:27:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7574/15526 [2:20:14<2:27:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7574/15526 [2:20:14<2:27:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7575/15526 [2:20:15<2:27:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7575/15526 [2:20:15<2:27:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7576/15526 [2:20:16<2:27:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7576/15526 [2:20:16<2:27:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7577/15526 [2:20:16<2:27:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7577/15526 [2:20:16<2:27:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7578/15526 [2:20:17<2:27:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7578/15526 [2:20:17<2:27:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7579/15526 [2:20:18<2:27:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7579/15526 [2:20:18<2:27:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7580/15526 [2:20:19<2:27:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7580/15526 [2:20:19<2:27:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7581/15526 [2:20:20<2:27:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7581/15526 [2:20:20<2:27:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7582/15526 [2:20:21<2:27:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7582/15526 [2:20:21<2:27:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7583/15526 [2:20:22<2:27:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7583/15526 [2:20:22<2:27:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7584/15526 [2:20:29<2:27:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7584/15526 [2:20:29<2:27:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7585/15526 [2:20:30<2:27:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7585/15526 [2:20:30<2:27:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7586/15526 [2:20:31<2:27:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7586/15526 [2:20:31<2:27:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7587/15526 [2:20:31<2:27:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7587/15526 [2:20:31<2:27:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7588/15526 [2:20:32<2:27:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7588/15526 [2:20:32<2:27:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7589/15526 [2:20:33<2:26:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7589/15526 [2:20:33<2:26:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7590/15526 [2:20:33<2:26:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7590/15526 [2:20:33<2:26:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7591/15526 [2:20:34<2:26:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7591/15526 [2:20:34<2:26:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7592/15526 [2:20:35<2:26:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7592/15526 [2:20:35<2:26:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7593/15526 [2:20:36<2:26:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7593/15526 [2:20:36<2:26:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7594/15526 [2:20:37<2:26:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7594/15526 [2:20:37<2:26:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7595/15526 [2:20:38<2:26:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7595/15526 [2:20:38<2:26:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7596/15526 [2:20:39<2:26:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7596/15526 [2:20:39<2:26:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7597/15526 [2:20:39<2:26:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7597/15526 [2:20:39<2:26:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7598/15526 [2:20:40<2:26:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7598/15526 [2:20:40<2:26:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7599/15526 [2:20:41<2:26:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7599/15526 [2:20:41<2:26:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7600/15526 [2:20:42<2:26:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7600/15526 [2:20:42<2:26:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7601/15526 [2:20:42<2:26:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7601/15526 [2:20:42<2:26:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7602/15526 [2:20:43<2:26:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7602/15526 [2:20:43<2:26:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7603/15526 [2:20:44<2:26:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7603/15526 [2:20:44<2:26:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7604/15526 [2:20:45<2:26:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7604/15526 [2:20:45<2:26:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7605/15526 [2:20:46<2:26:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7605/15526 [2:20:46<2:26:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7606/15526 [2:20:46<2:26:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7606/15526 [2:20:46<2:26:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7607/15526 [2:20:47<2:26:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7607/15526 [2:20:47<2:26:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7608/15526 [2:20:48<2:26:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7608/15526 [2:20:48<2:26:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7609/15526 [2:20:48<2:26:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7609/15526 [2:20:48<2:26:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7610/15526 [2:20:49<2:26:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7610/15526 [2:20:49<2:26:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7611/15526 [2:20:50<2:26:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7611/15526 [2:20:50<2:26:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7612/15526 [2:20:51<2:26:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7612/15526 [2:20:51<2:26:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7613/15526 [2:20:52<2:26:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7613/15526 [2:20:52<2:26:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7614/15526 [2:20:53<2:26:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7614/15526 [2:20:53<2:26:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7615/15526 [2:20:53<2:26:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7615/15526 [2:20:53<2:26:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7616/15526 [2:21:03<2:26:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7616/15526 [2:21:03<2:26:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7617/15526 [2:21:03<2:26:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7617/15526 [2:21:03<2:26:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7618/15526 [2:21:04<2:26:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7618/15526 [2:21:04<2:26:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7619/15526 [2:21:05<2:26:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7619/15526 [2:21:05<2:26:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7620/15526 [2:21:06<2:26:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7620/15526 [2:21:06<2:26:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7621/15526 [2:21:07<2:26:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7621/15526 [2:21:07<2:26:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7622/15526 [2:21:07<2:26:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7622/15526 [2:21:07<2:26:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7623/15526 [2:21:08<2:26:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7623/15526 [2:21:08<2:26:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7624/15526 [2:21:09<2:26:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7624/15526 [2:21:09<2:26:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7625/15526 [2:21:10<2:26:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7625/15526 [2:21:10<2:26:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7626/15526 [2:21:11<2:26:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7626/15526 [2:21:11<2:26:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7627/15526 [2:21:12<2:26:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7627/15526 [2:21:12<2:26:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7628/15526 [2:21:12<2:26:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7628/15526 [2:21:12<2:26:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7629/15526 [2:21:13<2:26:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7629/15526 [2:21:13<2:26:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7630/15526 [2:21:14<2:26:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7630/15526 [2:21:14<2:26:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7631/15526 [2:21:15<2:26:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7631/15526 [2:21:15<2:26:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7632/15526 [2:21:16<2:26:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7632/15526 [2:21:16<2:26:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7633/15526 [2:21:17<2:26:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7633/15526 [2:21:17<2:26:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7634/15526 [2:21:17<2:26:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7634/15526 [2:21:17<2:26:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7635/15526 [2:21:18<2:26:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7635/15526 [2:21:18<2:26:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7636/15526 [2:21:19<2:26:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7636/15526 [2:21:19<2:26:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7637/15526 [2:21:20<2:26:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7637/15526 [2:21:20<2:26:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7638/15526 [2:21:21<2:25:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7638/15526 [2:21:21<2:25:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7639/15526 [2:21:22<2:25:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7639/15526 [2:21:22<2:25:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7640/15526 [2:21:23<2:25:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7640/15526 [2:21:23<2:25:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7641/15526 [2:21:25<2:25:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7641/15526 [2:21:25<2:25:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7642/15526 [2:21:25<2:25:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7642/15526 [2:21:25<2:25:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7643/15526 [2:21:26<2:25:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7643/15526 [2:21:26<2:25:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7644/15526 [2:21:27<2:25:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7644/15526 [2:21:27<2:25:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7645/15526 [2:21:27<2:25:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7645/15526 [2:21:27<2:25:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7646/15526 [2:21:28<2:25:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7646/15526 [2:21:28<2:25:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7647/15526 [2:21:29<2:25:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7647/15526 [2:21:29<2:25:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7648/15526 [2:21:37<2:25:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7648/15526 [2:21:37<2:25:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7649/15526 [2:21:38<2:25:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7649/15526 [2:21:38<2:25:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7650/15526 [2:21:39<2:25:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7650/15526 [2:21:39<2:25:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7651/15526 [2:21:40<2:25:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7651/15526 [2:21:40<2:25:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7652/15526 [2:21:40<2:25:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7652/15526 [2:21:40<2:25:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7653/15526 [2:21:41<2:25:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7653/15526 [2:21:41<2:25:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7654/15526 [2:21:42<2:25:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7654/15526 [2:21:42<2:25:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7655/15526 [2:21:42<2:25:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7655/15526 [2:21:42<2:25:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7656/15526 [2:21:43<2:25:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7656/15526 [2:21:43<2:25:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7657/15526 [2:21:44<2:25:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7657/15526 [2:21:44<2:25:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7658/15526 [2:21:44<2:25:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7658/15526 [2:21:44<2:25:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7659/15526 [2:21:45<2:25:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7659/15526 [2:21:45<2:25:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7660/15526 [2:21:46<2:25:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7660/15526 [2:21:46<2:25:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7661/15526 [2:21:46<2:25:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7661/15526 [2:21:46<2:25:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7662/15526 [2:21:47<2:25:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7662/15526 [2:21:47<2:25:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7663/15526 [2:21:48<2:25:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7663/15526 [2:21:48<2:25:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7664/15526 [2:21:49<2:25:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7664/15526 [2:21:49<2:25:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7665/15526 [2:21:50<2:25:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7665/15526 [2:21:50<2:25:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7666/15526 [2:21:51<2:25:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7666/15526 [2:21:51<2:25:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7667/15526 [2:21:52<2:25:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7667/15526 [2:21:52<2:25:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7668/15526 [2:21:53<2:25:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7668/15526 [2:21:53<2:25:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7669/15526 [2:21:55<2:25:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7669/15526 [2:21:55<2:25:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7670/15526 [2:21:55<2:25:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7670/15526 [2:21:55<2:25:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7671/15526 [2:21:56<2:25:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7671/15526 [2:21:56<2:25:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7672/15526 [2:21:57<2:25:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7672/15526 [2:21:57<2:25:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7673/15526 [2:21:58<2:25:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7673/15526 [2:21:58<2:25:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7674/15526 [2:21:59<2:25:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7674/15526 [2:21:59<2:25:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7675/15526 [2:22:00<2:25:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7675/15526 [2:22:00<2:25:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7676/15526 [2:22:00<2:25:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7676/15526 [2:22:00<2:25:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7677/15526 [2:22:01<2:25:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7677/15526 [2:22:01<2:25:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7678/15526 [2:22:02<2:25:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7678/15526 [2:22:02<2:25:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7679/15526 [2:22:03<2:25:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7679/15526 [2:22:03<2:25:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7680/15526 [2:22:11<2:25:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7680/15526 [2:22:11<2:25:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7681/15526 [2:22:13<2:25:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7681/15526 [2:22:13<2:25:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7682/15526 [2:22:13<2:25:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7682/15526 [2:22:13<2:25:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7683/15526 [2:22:15<2:25:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7683/15526 [2:22:15<2:25:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7684/15526 [2:22:15<2:25:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7684/15526 [2:22:15<2:25:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 7685/15526 [2:22:16<2:25:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  49%|▍| 7685/15526 [2:22:16<2:25:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7686/15526 [2:22:17<2:25:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7686/15526 [2:22:17<2:25:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7687/15526 [2:22:17<2:25:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7687/15526 [2:22:17<2:25:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7688/15526 [2:22:18<2:25:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7688/15526 [2:22:18<2:25:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7689/15526 [2:22:19<2:25:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7689/15526 [2:22:19<2:25:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7690/15526 [2:22:20<2:25:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7690/15526 [2:22:20<2:25:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7691/15526 [2:22:21<2:25:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7691/15526 [2:22:21<2:25:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7692/15526 [2:22:22<2:24:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7692/15526 [2:22:22<2:24:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7693/15526 [2:22:23<2:24:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7693/15526 [2:22:23<2:24:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7694/15526 [2:22:24<2:24:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7694/15526 [2:22:24<2:24:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7695/15526 [2:22:25<2:24:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7695/15526 [2:22:25<2:24:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7696/15526 [2:22:25<2:24:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7696/15526 [2:22:25<2:24:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7697/15526 [2:22:27<2:24:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7697/15526 [2:22:27<2:24:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7698/15526 [2:22:27<2:24:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7698/15526 [2:22:27<2:24:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7699/15526 [2:22:29<2:24:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7699/15526 [2:22:29<2:24:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7700/15526 [2:22:29<2:24:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7700/15526 [2:22:29<2:24:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7701/15526 [2:22:30<2:24:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7701/15526 [2:22:30<2:24:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7702/15526 [2:22:31<2:24:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7702/15526 [2:22:31<2:24:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7703/15526 [2:22:32<2:24:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7703/15526 [2:22:32<2:24:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7704/15526 [2:22:33<2:24:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7704/15526 [2:22:33<2:24:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7705/15526 [2:22:34<2:24:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7705/15526 [2:22:34<2:24:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7706/15526 [2:22:35<2:24:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7706/15526 [2:22:35<2:24:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7707/15526 [2:22:36<2:24:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7707/15526 [2:22:36<2:24:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7708/15526 [2:22:36<2:24:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7708/15526 [2:22:36<2:24:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7709/15526 [2:22:37<2:24:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7709/15526 [2:22:37<2:24:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7710/15526 [2:22:38<2:24:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7710/15526 [2:22:38<2:24:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7711/15526 [2:22:38<2:24:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7711/15526 [2:22:38<2:24:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7712/15526 [2:22:46<2:24:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7712/15526 [2:22:46<2:24:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7713/15526 [2:22:47<2:24:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7713/15526 [2:22:47<2:24:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7714/15526 [2:22:48<2:24:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7714/15526 [2:22:48<2:24:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7715/15526 [2:22:48<2:24:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7715/15526 [2:22:48<2:24:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7716/15526 [2:22:49<2:24:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7716/15526 [2:22:49<2:24:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7717/15526 [2:22:50<2:24:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7717/15526 [2:22:50<2:24:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7718/15526 [2:22:51<2:24:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7718/15526 [2:22:51<2:24:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7719/15526 [2:22:52<2:24:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7719/15526 [2:22:52<2:24:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7720/15526 [2:22:53<2:24:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7720/15526 [2:22:53<2:24:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7721/15526 [2:22:53<2:24:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7721/15526 [2:22:53<2:24:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7722/15526 [2:22:54<2:24:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7722/15526 [2:22:54<2:24:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7723/15526 [2:22:55<2:24:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7723/15526 [2:22:55<2:24:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7724/15526 [2:22:55<2:24:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7724/15526 [2:22:55<2:24:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7725/15526 [2:22:56<2:24:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7725/15526 [2:22:56<2:24:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7726/15526 [2:22:57<2:24:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7726/15526 [2:22:57<2:24:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7727/15526 [2:22:58<2:24:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7727/15526 [2:22:58<2:24:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7728/15526 [2:22:59<2:24:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7728/15526 [2:22:59<2:24:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7729/15526 [2:22:59<2:24:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7729/15526 [2:22:59<2:24:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7730/15526 [2:23:00<2:24:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7730/15526 [2:23:00<2:24:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7731/15526 [2:23:01<2:24:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7731/15526 [2:23:01<2:24:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7732/15526 [2:23:02<2:24:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7732/15526 [2:23:02<2:24:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7733/15526 [2:23:03<2:24:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7733/15526 [2:23:03<2:24:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7734/15526 [2:23:04<2:24:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7734/15526 [2:23:04<2:24:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7735/15526 [2:23:05<2:24:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7735/15526 [2:23:05<2:24:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7736/15526 [2:23:06<2:24:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7736/15526 [2:23:06<2:24:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7737/15526 [2:23:07<2:24:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7737/15526 [2:23:07<2:24:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7738/15526 [2:23:07<2:24:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7738/15526 [2:23:07<2:24:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7739/15526 [2:23:08<2:24:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7739/15526 [2:23:08<2:24:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7740/15526 [2:23:09<2:24:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7740/15526 [2:23:09<2:24:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7741/15526 [2:23:10<2:23:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7741/15526 [2:23:10<2:23:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7742/15526 [2:23:11<2:23:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7742/15526 [2:23:11<2:23:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7743/15526 [2:23:12<2:23:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7743/15526 [2:23:12<2:23:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7744/15526 [2:23:21<2:24:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7744/15526 [2:23:21<2:24:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7745/15526 [2:23:21<2:24:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7745/15526 [2:23:21<2:24:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7746/15526 [2:23:22<2:24:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7746/15526 [2:23:22<2:24:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7747/15526 [2:23:23<2:23:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7747/15526 [2:23:23<2:23:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7748/15526 [2:23:24<2:23:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7748/15526 [2:23:24<2:23:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7749/15526 [2:23:25<2:23:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7749/15526 [2:23:25<2:23:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7750/15526 [2:23:26<2:23:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7750/15526 [2:23:26<2:23:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7751/15526 [2:23:26<2:23:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7751/15526 [2:23:26<2:23:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7752/15526 [2:23:27<2:23:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7752/15526 [2:23:27<2:23:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7753/15526 [2:23:28<2:23:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7753/15526 [2:23:28<2:23:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7754/15526 [2:23:29<2:23:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7754/15526 [2:23:29<2:23:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7755/15526 [2:23:30<2:23:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7755/15526 [2:23:30<2:23:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7756/15526 [2:23:31<2:23:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7756/15526 [2:23:31<2:23:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7757/15526 [2:23:31<2:23:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7757/15526 [2:23:31<2:23:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7758/15526 [2:23:32<2:23:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7758/15526 [2:23:32<2:23:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7759/15526 [2:23:33<2:23:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7759/15526 [2:23:33<2:23:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7760/15526 [2:23:33<2:23:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7760/15526 [2:23:33<2:23:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7761/15526 [2:23:34<2:23:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7761/15526 [2:23:34<2:23:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 7762/15526 [2:23:35<2:23:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▍| 7762/15526 [2:23:35<2:23:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7763/15526 [2:23:36<2:23:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7763/15526 [2:23:36<2:23:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7764/15526 [2:23:37<2:23:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7764/15526 [2:23:37<2:23:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7765/15526 [2:23:37<2:23:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7765/15526 [2:23:37<2:23:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7766/15526 [2:23:38<2:23:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7766/15526 [2:23:38<2:23:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7767/15526 [2:23:39<2:23:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7767/15526 [2:23:39<2:23:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7768/15526 [2:23:39<2:23:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7768/15526 [2:23:39<2:23:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7769/15526 [2:23:40<2:23:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7769/15526 [2:23:40<2:23:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7770/15526 [2:23:41<2:23:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7770/15526 [2:23:41<2:23:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7771/15526 [2:23:42<2:23:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7771/15526 [2:23:42<2:23:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7772/15526 [2:23:43<2:23:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7772/15526 [2:23:43<2:23:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7773/15526 [2:23:43<2:23:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7773/15526 [2:23:43<2:23:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7774/15526 [2:23:45<2:23:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7774/15526 [2:23:45<2:23:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7775/15526 [2:23:45<2:23:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7775/15526 [2:23:45<2:23:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7776/15526 [2:23:55<2:23:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7776/15526 [2:23:55<2:23:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7777/15526 [2:23:56<2:23:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7777/15526 [2:23:56<2:23:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7778/15526 [2:23:57<2:23:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7778/15526 [2:23:57<2:23:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7779/15526 [2:23:58<2:23:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7779/15526 [2:23:58<2:23:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7780/15526 [2:23:59<2:23:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7780/15526 [2:23:59<2:23:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7781/15526 [2:24:00<2:23:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7781/15526 [2:24:00<2:23:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7782/15526 [2:24:01<2:23:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7782/15526 [2:24:01<2:23:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7783/15526 [2:24:01<2:23:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7783/15526 [2:24:01<2:23:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7784/15526 [2:24:02<2:23:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7784/15526 [2:24:02<2:23:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7785/15526 [2:24:03<2:23:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7785/15526 [2:24:03<2:23:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7786/15526 [2:24:03<2:23:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7786/15526 [2:24:03<2:23:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7787/15526 [2:24:04<2:23:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7787/15526 [2:24:04<2:23:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7788/15526 [2:24:05<2:23:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7788/15526 [2:24:05<2:23:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7789/15526 [2:24:06<2:23:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7789/15526 [2:24:06<2:23:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7790/15526 [2:24:07<2:23:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7790/15526 [2:24:07<2:23:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7791/15526 [2:24:07<2:23:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7791/15526 [2:24:07<2:23:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7792/15526 [2:24:09<2:23:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7792/15526 [2:24:09<2:23:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7793/15526 [2:24:10<2:23:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7793/15526 [2:24:10<2:23:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7794/15526 [2:24:11<2:23:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7794/15526 [2:24:11<2:23:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7795/15526 [2:24:12<2:23:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7795/15526 [2:24:12<2:23:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7796/15526 [2:24:13<2:23:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7796/15526 [2:24:13<2:23:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7797/15526 [2:24:15<2:22:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7797/15526 [2:24:15<2:22:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7798/15526 [2:24:16<2:22:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7798/15526 [2:24:16<2:22:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7799/15526 [2:24:17<2:22:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7799/15526 [2:24:17<2:22:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7800/15526 [2:24:18<2:22:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7800/15526 [2:24:18<2:22:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7801/15526 [2:24:18<2:22:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7801/15526 [2:24:18<2:22:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7802/15526 [2:24:20<2:22:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7802/15526 [2:24:20<2:22:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7803/15526 [2:24:20<2:22:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7803/15526 [2:24:20<2:22:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7804/15526 [2:24:21<2:22:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7804/15526 [2:24:21<2:22:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7805/15526 [2:24:22<2:22:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7805/15526 [2:24:22<2:22:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7806/15526 [2:24:23<2:22:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7806/15526 [2:24:23<2:22:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7807/15526 [2:24:24<2:22:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7807/15526 [2:24:24<2:22:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7808/15526 [2:24:30<2:22:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7808/15526 [2:24:30<2:22:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7809/15526 [2:24:30<2:22:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7809/15526 [2:24:30<2:22:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7810/15526 [2:24:31<2:22:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7810/15526 [2:24:31<2:22:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7811/15526 [2:24:32<2:22:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7811/15526 [2:24:32<2:22:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7812/15526 [2:24:33<2:22:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7812/15526 [2:24:33<2:22:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7813/15526 [2:24:34<2:22:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7813/15526 [2:24:34<2:22:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7814/15526 [2:24:35<2:22:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7814/15526 [2:24:35<2:22:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7815/15526 [2:24:35<2:22:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7815/15526 [2:24:35<2:22:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7816/15526 [2:24:37<2:22:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7816/15526 [2:24:37<2:22:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7817/15526 [2:24:38<2:22:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7817/15526 [2:24:38<2:22:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7818/15526 [2:24:38<2:22:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7818/15526 [2:24:38<2:22:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7819/15526 [2:24:39<2:22:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7819/15526 [2:24:39<2:22:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7820/15526 [2:24:40<2:22:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7820/15526 [2:24:40<2:22:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7821/15526 [2:24:41<2:22:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7821/15526 [2:24:41<2:22:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7822/15526 [2:24:43<2:22:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7822/15526 [2:24:43<2:22:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7823/15526 [2:24:43<2:22:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7823/15526 [2:24:43<2:22:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7824/15526 [2:24:44<2:22:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7824/15526 [2:24:44<2:22:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7825/15526 [2:24:45<2:22:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7825/15526 [2:24:45<2:22:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7826/15526 [2:24:45<2:22:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7826/15526 [2:24:45<2:22:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7827/15526 [2:24:47<2:22:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7827/15526 [2:24:47<2:22:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7828/15526 [2:24:48<2:22:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7828/15526 [2:24:48<2:22:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7829/15526 [2:24:49<2:22:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7829/15526 [2:24:49<2:22:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7830/15526 [2:24:50<2:22:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7830/15526 [2:24:50<2:22:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7831/15526 [2:24:50<2:22:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7831/15526 [2:24:50<2:22:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7832/15526 [2:24:51<2:22:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7832/15526 [2:24:51<2:22:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7833/15526 [2:24:52<2:22:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7833/15526 [2:24:52<2:22:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7834/15526 [2:24:53<2:22:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7834/15526 [2:24:53<2:22:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7835/15526 [2:24:53<2:22:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7835/15526 [2:24:53<2:22:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7836/15526 [2:24:54<2:22:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7836/15526 [2:24:54<2:22:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7837/15526 [2:24:55<2:22:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7837/15526 [2:24:55<2:22:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7838/15526 [2:24:55<2:22:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7838/15526 [2:24:55<2:22:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7839/15526 [2:24:57<2:22:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7839/15526 [2:24:57<2:22:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 7840/15526 [2:25:04<2:22:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  50%|▌| 7840/15526 [2:25:04<2:22:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7841/15526 [2:25:04<2:22:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7841/15526 [2:25:04<2:22:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7842/15526 [2:25:05<2:22:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7842/15526 [2:25:05<2:22:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7843/15526 [2:25:06<2:22:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7843/15526 [2:25:06<2:22:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7844/15526 [2:25:07<2:22:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7844/15526 [2:25:07<2:22:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7845/15526 [2:25:07<2:22:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7845/15526 [2:25:07<2:22:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7846/15526 [2:25:08<2:22:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7846/15526 [2:25:08<2:22:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7847/15526 [2:25:09<2:22:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7847/15526 [2:25:09<2:22:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7848/15526 [2:25:10<2:22:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7848/15526 [2:25:10<2:22:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7849/15526 [2:25:11<2:22:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7849/15526 [2:25:11<2:22:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7850/15526 [2:25:12<2:21:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7850/15526 [2:25:12<2:21:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7851/15526 [2:25:13<2:21:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7851/15526 [2:25:13<2:21:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7852/15526 [2:25:14<2:21:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7852/15526 [2:25:14<2:21:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7853/15526 [2:25:15<2:21:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7853/15526 [2:25:15<2:21:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7854/15526 [2:25:16<2:21:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7854/15526 [2:25:16<2:21:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7855/15526 [2:25:16<2:21:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7855/15526 [2:25:16<2:21:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7856/15526 [2:25:17<2:21:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7856/15526 [2:25:17<2:21:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7857/15526 [2:25:18<2:21:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7857/15526 [2:25:18<2:21:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7858/15526 [2:25:18<2:21:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7858/15526 [2:25:18<2:21:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7859/15526 [2:25:19<2:21:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7859/15526 [2:25:19<2:21:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7860/15526 [2:25:20<2:21:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7860/15526 [2:25:20<2:21:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7861/15526 [2:25:20<2:21:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7861/15526 [2:25:20<2:21:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7862/15526 [2:25:21<2:21:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7862/15526 [2:25:21<2:21:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7863/15526 [2:25:22<2:21:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7863/15526 [2:25:22<2:21:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7864/15526 [2:25:22<2:21:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7864/15526 [2:25:22<2:21:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7865/15526 [2:25:24<2:21:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7865/15526 [2:25:24<2:21:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7866/15526 [2:25:24<2:21:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7866/15526 [2:25:24<2:21:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7867/15526 [2:25:25<2:21:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7867/15526 [2:25:25<2:21:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7868/15526 [2:25:26<2:21:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7868/15526 [2:25:26<2:21:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7869/15526 [2:25:27<2:21:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7869/15526 [2:25:27<2:21:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7870/15526 [2:25:27<2:21:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7870/15526 [2:25:27<2:21:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7871/15526 [2:25:29<2:21:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7871/15526 [2:25:29<2:21:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7872/15526 [2:25:38<2:21:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7872/15526 [2:25:38<2:21:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7873/15526 [2:25:38<2:21:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7873/15526 [2:25:38<2:21:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7874/15526 [2:25:39<2:21:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7874/15526 [2:25:39<2:21:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7875/15526 [2:25:40<2:21:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7875/15526 [2:25:40<2:21:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7876/15526 [2:25:41<2:21:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7876/15526 [2:25:41<2:21:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7877/15526 [2:25:41<2:21:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7877/15526 [2:25:41<2:21:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7878/15526 [2:25:42<2:21:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7878/15526 [2:25:42<2:21:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7879/15526 [2:25:43<2:21:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7879/15526 [2:25:43<2:21:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7880/15526 [2:25:44<2:21:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7880/15526 [2:25:44<2:21:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7881/15526 [2:25:45<2:21:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7881/15526 [2:25:45<2:21:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7882/15526 [2:25:46<2:21:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7882/15526 [2:25:46<2:21:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7883/15526 [2:25:47<2:21:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7883/15526 [2:25:47<2:21:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7884/15526 [2:25:47<2:21:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7884/15526 [2:25:47<2:21:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7885/15526 [2:25:48<2:21:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7885/15526 [2:25:48<2:21:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7886/15526 [2:25:49<2:21:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7886/15526 [2:25:49<2:21:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7887/15526 [2:25:50<2:21:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7887/15526 [2:25:50<2:21:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7888/15526 [2:25:51<2:21:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7888/15526 [2:25:51<2:21:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7889/15526 [2:25:52<2:21:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7889/15526 [2:25:52<2:21:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7890/15526 [2:25:53<2:21:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7890/15526 [2:25:53<2:21:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7891/15526 [2:25:54<2:21:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7891/15526 [2:25:54<2:21:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7892/15526 [2:25:55<2:21:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7892/15526 [2:25:55<2:21:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7893/15526 [2:25:56<2:21:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7893/15526 [2:25:56<2:21:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7894/15526 [2:25:56<2:21:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7894/15526 [2:25:56<2:21:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7895/15526 [2:25:57<2:21:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7895/15526 [2:25:57<2:21:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7896/15526 [2:25:58<2:21:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7896/15526 [2:25:58<2:21:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7897/15526 [2:25:58<2:21:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7897/15526 [2:25:58<2:21:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7898/15526 [2:25:59<2:21:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7898/15526 [2:25:59<2:21:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7899/15526 [2:26:01<2:20:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7899/15526 [2:26:01<2:20:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7900/15526 [2:26:02<2:20:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7900/15526 [2:26:02<2:20:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7901/15526 [2:26:03<2:20:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7901/15526 [2:26:03<2:20:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7902/15526 [2:26:04<2:20:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7902/15526 [2:26:04<2:20:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7903/15526 [2:26:04<2:20:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7903/15526 [2:26:04<2:20:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7904/15526 [2:26:11<2:20:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7904/15526 [2:26:11<2:20:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7905/15526 [2:26:12<2:20:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7905/15526 [2:26:12<2:20:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7906/15526 [2:26:13<2:20:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7906/15526 [2:26:13<2:20:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7907/15526 [2:26:13<2:20:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7907/15526 [2:26:13<2:20:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7908/15526 [2:26:14<2:20:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7908/15526 [2:26:14<2:20:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7909/15526 [2:26:15<2:20:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7909/15526 [2:26:15<2:20:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7910/15526 [2:26:16<2:20:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7910/15526 [2:26:16<2:20:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7911/15526 [2:26:16<2:20:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7911/15526 [2:26:16<2:20:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7912/15526 [2:26:17<2:20:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7912/15526 [2:26:17<2:20:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7913/15526 [2:26:18<2:20:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7913/15526 [2:26:18<2:20:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7914/15526 [2:26:19<2:20:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7914/15526 [2:26:19<2:20:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7915/15526 [2:26:21<2:20:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7915/15526 [2:26:21<2:20:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7916/15526 [2:26:21<2:20:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7916/15526 [2:26:21<2:20:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7917/15526 [2:26:22<2:20:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7917/15526 [2:26:22<2:20:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7918/15526 [2:26:23<2:20:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7918/15526 [2:26:23<2:20:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7919/15526 [2:26:24<2:20:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7919/15526 [2:26:24<2:20:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7920/15526 [2:26:25<2:20:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7920/15526 [2:26:25<2:20:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7921/15526 [2:26:26<2:20:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7921/15526 [2:26:26<2:20:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7922/15526 [2:26:27<2:20:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7922/15526 [2:26:27<2:20:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7923/15526 [2:26:27<2:20:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7923/15526 [2:26:27<2:20:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7924/15526 [2:26:28<2:20:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7924/15526 [2:26:28<2:20:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7925/15526 [2:26:29<2:20:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7925/15526 [2:26:29<2:20:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7926/15526 [2:26:30<2:20:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7926/15526 [2:26:30<2:20:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7927/15526 [2:26:31<2:20:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7927/15526 [2:26:31<2:20:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7928/15526 [2:26:31<2:20:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7928/15526 [2:26:31<2:20:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7929/15526 [2:26:32<2:20:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7929/15526 [2:26:33<2:20:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7930/15526 [2:26:33<2:20:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7930/15526 [2:26:33<2:20:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7931/15526 [2:26:34<2:20:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7931/15526 [2:26:34<2:20:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7932/15526 [2:26:35<2:20:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7932/15526 [2:26:35<2:20:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7933/15526 [2:26:35<2:20:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7933/15526 [2:26:35<2:20:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7934/15526 [2:26:37<2:20:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7934/15526 [2:26:37<2:20:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7935/15526 [2:26:37<2:20:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7935/15526 [2:26:37<2:20:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7936/15526 [2:26:45<2:20:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7936/15526 [2:26:45<2:20:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7937/15526 [2:26:46<2:20:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7937/15526 [2:26:46<2:20:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7938/15526 [2:26:47<2:20:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7938/15526 [2:26:47<2:20:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7939/15526 [2:26:47<2:20:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7939/15526 [2:26:47<2:20:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7940/15526 [2:26:48<2:20:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7940/15526 [2:26:48<2:20:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7941/15526 [2:26:49<2:20:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7941/15526 [2:26:49<2:20:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7942/15526 [2:26:49<2:20:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7942/15526 [2:26:49<2:20:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7943/15526 [2:26:50<2:20:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7943/15526 [2:26:50<2:20:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7944/15526 [2:26:51<2:20:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7944/15526 [2:26:51<2:20:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7945/15526 [2:26:52<2:20:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7945/15526 [2:26:52<2:20:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7946/15526 [2:26:53<2:20:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7946/15526 [2:26:53<2:20:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7947/15526 [2:26:55<2:20:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7947/15526 [2:26:55<2:20:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7948/15526 [2:26:56<2:20:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7948/15526 [2:26:56<2:20:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7949/15526 [2:26:56<2:20:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7949/15526 [2:26:56<2:20:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7950/15526 [2:26:57<2:20:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7950/15526 [2:26:57<2:20:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7951/15526 [2:26:58<2:20:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7951/15526 [2:26:58<2:20:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7952/15526 [2:26:59<2:20:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7952/15526 [2:26:59<2:20:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7953/15526 [2:27:00<2:19:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7953/15526 [2:27:00<2:19:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7954/15526 [2:27:00<2:19:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7954/15526 [2:27:00<2:19:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7955/15526 [2:27:01<2:19:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7955/15526 [2:27:01<2:19:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7956/15526 [2:27:02<2:19:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7956/15526 [2:27:02<2:19:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7957/15526 [2:27:02<2:19:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7957/15526 [2:27:02<2:19:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7958/15526 [2:27:04<2:19:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7958/15526 [2:27:04<2:19:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7959/15526 [2:27:04<2:19:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7959/15526 [2:27:04<2:19:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7960/15526 [2:27:05<2:19:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7960/15526 [2:27:05<2:19:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7961/15526 [2:27:06<2:19:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7961/15526 [2:27:06<2:19:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7962/15526 [2:27:06<2:19:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7962/15526 [2:27:06<2:19:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7963/15526 [2:27:07<2:19:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7963/15526 [2:27:07<2:19:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7964/15526 [2:27:08<2:19:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7964/15526 [2:27:08<2:19:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7965/15526 [2:27:08<2:19:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7965/15526 [2:27:08<2:19:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7966/15526 [2:27:09<2:19:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7966/15526 [2:27:09<2:19:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7967/15526 [2:27:10<2:19:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7967/15526 [2:27:10<2:19:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7968/15526 [2:27:20<2:19:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7968/15526 [2:27:20<2:19:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7969/15526 [2:27:21<2:19:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7969/15526 [2:27:21<2:19:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7970/15526 [2:27:22<2:19:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7970/15526 [2:27:22<2:19:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7971/15526 [2:27:23<2:19:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7971/15526 [2:27:23<2:19:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7972/15526 [2:27:24<2:19:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7972/15526 [2:27:24<2:19:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7973/15526 [2:27:24<2:19:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7973/15526 [2:27:24<2:19:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7974/15526 [2:27:25<2:19:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7974/15526 [2:27:25<2:19:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7975/15526 [2:27:26<2:19:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7975/15526 [2:27:26<2:19:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7976/15526 [2:27:28<2:19:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7976/15526 [2:27:28<2:19:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7977/15526 [2:27:28<2:19:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7977/15526 [2:27:28<2:19:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7978/15526 [2:27:30<2:19:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7978/15526 [2:27:30<2:19:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7979/15526 [2:27:31<2:19:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7979/15526 [2:27:31<2:19:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7980/15526 [2:27:32<2:19:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7980/15526 [2:27:32<2:19:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7981/15526 [2:27:33<2:19:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7981/15526 [2:27:33<2:19:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7982/15526 [2:27:34<2:19:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7982/15526 [2:27:34<2:19:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7983/15526 [2:27:35<2:19:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7983/15526 [2:27:35<2:19:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7984/15526 [2:27:36<2:19:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7984/15526 [2:27:36<2:19:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7985/15526 [2:27:36<2:19:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7985/15526 [2:27:36<2:19:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7986/15526 [2:27:37<2:19:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7986/15526 [2:27:37<2:19:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7987/15526 [2:27:38<2:19:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7987/15526 [2:27:38<2:19:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7988/15526 [2:27:39<2:19:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7988/15526 [2:27:39<2:19:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7989/15526 [2:27:40<2:19:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7989/15526 [2:27:40<2:19:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7990/15526 [2:27:41<2:19:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7990/15526 [2:27:41<2:19:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7991/15526 [2:27:42<2:19:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7991/15526 [2:27:42<2:19:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7992/15526 [2:27:43<2:19:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7992/15526 [2:27:43<2:19:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7993/15526 [2:27:44<2:19:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7993/15526 [2:27:44<2:19:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7994/15526 [2:27:45<2:19:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7994/15526 [2:27:45<2:19:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 7995/15526 [2:27:45<2:19:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  51%|▌| 7995/15526 [2:27:45<2:19:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 7996/15526 [2:27:47<2:19:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 7996/15526 [2:27:47<2:19:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 7997/15526 [2:27:48<2:19:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 7997/15526 [2:27:48<2:19:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 7998/15526 [2:27:48<2:19:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 7998/15526 [2:27:48<2:19:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 7999/15526 [2:27:49<2:19:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 7999/15526 [2:27:49<2:19:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8000/15526 [2:27:55<2:19:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8000/15526 [2:27:55<2:19:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8001/15526 [2:28:21<2:19:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8001/15526 [2:28:21<2:19:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8002/15526 [2:28:21<2:19:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8002/15526 [2:28:21<2:19:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8003/15526 [2:28:22<2:19:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8003/15526 [2:28:22<2:19:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8004/15526 [2:28:23<2:19:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8004/15526 [2:28:23<2:19:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8005/15526 [2:28:24<2:19:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8005/15526 [2:28:24<2:19:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8006/15526 [2:28:25<2:19:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8006/15526 [2:28:25<2:19:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8007/15526 [2:28:25<2:19:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8007/15526 [2:28:25<2:19:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8008/15526 [2:28:26<2:19:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8008/15526 [2:28:26<2:19:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8009/15526 [2:28:27<2:19:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8009/15526 [2:28:27<2:19:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8010/15526 [2:28:28<2:19:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8010/15526 [2:28:28<2:19:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8011/15526 [2:28:29<2:19:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8011/15526 [2:28:29<2:19:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8012/15526 [2:28:30<2:19:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8012/15526 [2:28:30<2:19:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8013/15526 [2:28:31<2:19:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8013/15526 [2:28:31<2:19:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8014/15526 [2:28:32<2:19:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8014/15526 [2:28:32<2:19:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8015/15526 [2:28:32<2:19:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8015/15526 [2:28:32<2:19:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8016/15526 [2:28:33<2:19:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8016/15526 [2:28:33<2:19:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8017/15526 [2:28:34<2:19:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8017/15526 [2:28:34<2:19:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8018/15526 [2:28:35<2:19:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8018/15526 [2:28:35<2:19:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8019/15526 [2:28:35<2:19:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8019/15526 [2:28:35<2:19:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8020/15526 [2:28:36<2:19:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8020/15526 [2:28:36<2:19:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8021/15526 [2:28:37<2:19:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8021/15526 [2:28:37<2:19:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8022/15526 [2:28:37<2:19:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8022/15526 [2:28:37<2:19:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8023/15526 [2:28:38<2:19:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8023/15526 [2:28:38<2:19:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8024/15526 [2:28:39<2:18:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8024/15526 [2:28:39<2:18:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8025/15526 [2:28:40<2:18:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8025/15526 [2:28:40<2:18:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8026/15526 [2:28:41<2:18:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8026/15526 [2:28:41<2:18:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8027/15526 [2:28:42<2:18:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8027/15526 [2:28:42<2:18:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8028/15526 [2:28:43<2:18:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8028/15526 [2:28:43<2:18:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8029/15526 [2:28:43<2:18:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8029/15526 [2:28:43<2:18:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8030/15526 [2:28:44<2:18:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8030/15526 [2:28:44<2:18:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8031/15526 [2:28:45<2:18:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8031/15526 [2:28:45<2:18:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8032/15526 [2:28:54<2:18:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8032/15526 [2:28:54<2:18:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8033/15526 [2:28:55<2:18:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8033/15526 [2:28:55<2:18:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8034/15526 [2:28:55<2:18:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8034/15526 [2:28:55<2:18:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8035/15526 [2:28:57<2:18:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8035/15526 [2:28:57<2:18:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8036/15526 [2:28:57<2:18:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8036/15526 [2:28:57<2:18:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8037/15526 [2:28:58<2:18:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8037/15526 [2:28:58<2:18:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8038/15526 [2:28:59<2:18:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8038/15526 [2:28:59<2:18:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8039/15526 [2:28:59<2:18:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8039/15526 [2:28:59<2:18:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8040/15526 [2:29:01<2:18:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8040/15526 [2:29:01<2:18:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8041/15526 [2:29:01<2:18:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8041/15526 [2:29:01<2:18:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8042/15526 [2:29:02<2:18:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8042/15526 [2:29:02<2:18:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8043/15526 [2:29:03<2:18:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8043/15526 [2:29:03<2:18:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8044/15526 [2:29:03<2:18:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8044/15526 [2:29:03<2:18:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8045/15526 [2:29:05<2:18:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8045/15526 [2:29:05<2:18:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8046/15526 [2:29:05<2:18:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8046/15526 [2:29:05<2:18:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8047/15526 [2:29:07<2:18:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8047/15526 [2:29:07<2:18:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8048/15526 [2:29:07<2:18:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8048/15526 [2:29:07<2:18:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8049/15526 [2:29:08<2:18:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8049/15526 [2:29:08<2:18:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8050/15526 [2:29:09<2:18:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8050/15526 [2:29:09<2:18:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8051/15526 [2:29:10<2:18:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8051/15526 [2:29:10<2:18:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8052/15526 [2:29:11<2:18:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8052/15526 [2:29:11<2:18:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8053/15526 [2:29:12<2:18:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8053/15526 [2:29:12<2:18:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8054/15526 [2:29:13<2:18:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8054/15526 [2:29:13<2:18:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8055/15526 [2:29:14<2:18:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8055/15526 [2:29:14<2:18:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8056/15526 [2:29:14<2:18:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8056/15526 [2:29:14<2:18:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8057/15526 [2:29:15<2:18:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8057/15526 [2:29:15<2:18:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8058/15526 [2:29:16<2:18:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8058/15526 [2:29:16<2:18:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8059/15526 [2:29:16<2:18:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8059/15526 [2:29:16<2:18:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8060/15526 [2:29:17<2:18:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8060/15526 [2:29:17<2:18:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8061/15526 [2:29:18<2:18:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8061/15526 [2:29:18<2:18:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8062/15526 [2:29:18<2:18:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8062/15526 [2:29:18<2:18:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8063/15526 [2:29:19<2:18:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8063/15526 [2:29:19<2:18:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8064/15526 [2:29:29<2:18:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8064/15526 [2:29:29<2:18:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8065/15526 [2:29:30<2:18:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8065/15526 [2:29:30<2:18:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8066/15526 [2:29:31<2:18:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8066/15526 [2:29:31<2:18:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8067/15526 [2:29:32<2:18:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8067/15526 [2:29:32<2:18:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8068/15526 [2:29:33<2:18:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8068/15526 [2:29:33<2:18:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8069/15526 [2:29:34<2:18:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8069/15526 [2:29:34<2:18:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8070/15526 [2:29:35<2:18:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8070/15526 [2:29:35<2:18:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8071/15526 [2:29:35<2:18:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8071/15526 [2:29:35<2:18:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8072/15526 [2:29:37<2:18:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8072/15526 [2:29:37<2:18:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8073/15526 [2:29:38<2:18:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8073/15526 [2:29:38<2:18:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8074/15526 [2:29:39<2:18:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8074/15526 [2:29:39<2:18:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8075/15526 [2:29:39<2:18:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8075/15526 [2:29:39<2:18:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8076/15526 [2:29:40<2:18:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8076/15526 [2:29:40<2:18:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8077/15526 [2:29:41<2:18:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8077/15526 [2:29:41<2:18:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8078/15526 [2:29:41<2:18:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8078/15526 [2:29:41<2:18:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8079/15526 [2:29:43<2:18:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8079/15526 [2:29:43<2:18:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8080/15526 [2:29:43<2:17:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8080/15526 [2:29:43<2:17:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8081/15526 [2:29:44<2:17:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8081/15526 [2:29:44<2:17:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8082/15526 [2:29:45<2:17:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8082/15526 [2:29:45<2:17:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8083/15526 [2:29:46<2:17:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8083/15526 [2:29:46<2:17:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8084/15526 [2:29:47<2:17:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8084/15526 [2:29:47<2:17:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8085/15526 [2:29:48<2:17:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8085/15526 [2:29:48<2:17:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8086/15526 [2:29:49<2:17:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8086/15526 [2:29:49<2:17:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8087/15526 [2:29:50<2:17:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8087/15526 [2:29:50<2:17:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8088/15526 [2:29:50<2:17:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8088/15526 [2:29:50<2:17:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8089/15526 [2:29:51<2:17:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8089/15526 [2:29:51<2:17:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8090/15526 [2:29:52<2:17:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8090/15526 [2:29:52<2:17:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8091/15526 [2:29:53<2:17:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8091/15526 [2:29:53<2:17:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8092/15526 [2:29:54<2:17:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8092/15526 [2:29:54<2:17:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8093/15526 [2:29:55<2:17:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8093/15526 [2:29:55<2:17:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8094/15526 [2:29:56<2:17:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8094/15526 [2:29:56<2:17:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8095/15526 [2:29:56<2:17:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8095/15526 [2:29:56<2:17:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8096/15526 [2:30:03<2:17:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8096/15526 [2:30:03<2:17:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8097/15526 [2:30:03<2:17:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8097/15526 [2:30:03<2:17:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8098/15526 [2:30:04<2:17:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8098/15526 [2:30:04<2:17:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8099/15526 [2:30:05<2:17:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8099/15526 [2:30:05<2:17:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8100/15526 [2:30:06<2:17:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8100/15526 [2:30:06<2:17:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8101/15526 [2:30:07<2:17:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8101/15526 [2:30:07<2:17:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8102/15526 [2:30:08<2:17:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8102/15526 [2:30:08<2:17:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8103/15526 [2:30:09<2:17:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8103/15526 [2:30:09<2:17:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8104/15526 [2:30:10<2:17:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8104/15526 [2:30:10<2:17:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8105/15526 [2:30:11<2:17:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8105/15526 [2:30:11<2:17:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8106/15526 [2:30:12<2:17:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8106/15526 [2:30:12<2:17:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8107/15526 [2:30:13<2:17:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8107/15526 [2:30:13<2:17:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8108/15526 [2:30:14<2:17:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8108/15526 [2:30:14<2:17:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8109/15526 [2:30:14<2:17:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8109/15526 [2:30:14<2:17:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8110/15526 [2:30:15<2:17:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8110/15526 [2:30:15<2:17:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8111/15526 [2:30:16<2:17:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8111/15526 [2:30:16<2:17:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8112/15526 [2:30:17<2:17:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8112/15526 [2:30:17<2:17:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8113/15526 [2:30:17<2:17:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8113/15526 [2:30:17<2:17:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8114/15526 [2:30:19<2:17:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8114/15526 [2:30:19<2:17:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8115/15526 [2:30:20<2:17:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8115/15526 [2:30:20<2:17:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8116/15526 [2:30:21<2:17:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8116/15526 [2:30:21<2:17:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8117/15526 [2:30:21<2:17:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8117/15526 [2:30:21<2:17:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8118/15526 [2:30:22<2:17:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8118/15526 [2:30:22<2:17:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8119/15526 [2:30:23<2:17:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8119/15526 [2:30:23<2:17:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8120/15526 [2:30:23<2:17:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8120/15526 [2:30:23<2:17:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8121/15526 [2:30:24<2:17:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8121/15526 [2:30:24<2:17:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8122/15526 [2:30:25<2:17:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8122/15526 [2:30:25<2:17:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8123/15526 [2:30:26<2:17:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8123/15526 [2:30:26<2:17:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8124/15526 [2:30:26<2:17:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8124/15526 [2:30:26<2:17:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8125/15526 [2:30:27<2:17:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8125/15526 [2:30:27<2:17:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8126/15526 [2:30:28<2:17:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8126/15526 [2:30:28<2:17:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8127/15526 [2:30:29<2:17:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8127/15526 [2:30:29<2:17:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8128/15526 [2:30:37<2:17:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8128/15526 [2:30:37<2:17:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8129/15526 [2:30:38<2:17:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8129/15526 [2:30:38<2:17:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8130/15526 [2:30:38<2:17:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8130/15526 [2:30:38<2:17:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8131/15526 [2:30:39<2:17:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8131/15526 [2:30:39<2:17:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8132/15526 [2:30:40<2:17:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8132/15526 [2:30:40<2:17:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8133/15526 [2:30:41<2:16:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8133/15526 [2:30:41<2:16:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8134/15526 [2:30:41<2:16:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8134/15526 [2:30:41<2:16:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8135/15526 [2:30:43<2:16:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8135/15526 [2:30:43<2:16:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8136/15526 [2:30:44<2:16:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8136/15526 [2:30:44<2:16:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8137/15526 [2:30:45<2:16:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8137/15526 [2:30:45<2:16:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8138/15526 [2:30:46<2:16:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8138/15526 [2:30:46<2:16:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8139/15526 [2:30:47<2:16:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8139/15526 [2:30:47<2:16:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8140/15526 [2:30:48<2:16:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8140/15526 [2:30:48<2:16:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8141/15526 [2:30:49<2:16:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8141/15526 [2:30:49<2:16:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8142/15526 [2:30:50<2:16:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8142/15526 [2:30:50<2:16:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8143/15526 [2:30:52<2:16:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8143/15526 [2:30:52<2:16:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8144/15526 [2:30:52<2:16:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8144/15526 [2:30:52<2:16:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8145/15526 [2:30:53<2:16:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8145/15526 [2:30:53<2:16:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8146/15526 [2:30:54<2:16:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8146/15526 [2:30:54<2:16:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8147/15526 [2:30:54<2:16:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8147/15526 [2:30:54<2:16:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8148/15526 [2:30:55<2:16:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8148/15526 [2:30:55<2:16:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8149/15526 [2:30:56<2:16:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8149/15526 [2:30:56<2:16:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8150/15526 [2:30:57<2:16:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8150/15526 [2:30:57<2:16:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 8151/15526 [2:30:58<2:16:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  52%|▌| 8151/15526 [2:30:58<2:16:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8152/15526 [2:30:58<2:16:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8152/15526 [2:30:58<2:16:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8153/15526 [2:30:59<2:16:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8153/15526 [2:30:59<2:16:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8154/15526 [2:31:00<2:16:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8154/15526 [2:31:00<2:16:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8155/15526 [2:31:00<2:16:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8155/15526 [2:31:00<2:16:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8156/15526 [2:31:01<2:16:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8156/15526 [2:31:01<2:16:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8157/15526 [2:31:02<2:16:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8157/15526 [2:31:02<2:16:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8158/15526 [2:31:03<2:16:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8158/15526 [2:31:03<2:16:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8159/15526 [2:31:04<2:16:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8159/15526 [2:31:04<2:16:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8160/15526 [2:31:11<2:16:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8160/15526 [2:31:11<2:16:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8161/15526 [2:31:12<2:16:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8161/15526 [2:31:12<2:16:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8162/15526 [2:31:13<2:16:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8162/15526 [2:31:13<2:16:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8163/15526 [2:31:13<2:16:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8163/15526 [2:31:13<2:16:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8164/15526 [2:31:14<2:16:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8164/15526 [2:31:14<2:16:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8165/15526 [2:31:15<2:16:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8165/15526 [2:31:15<2:16:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8166/15526 [2:31:15<2:16:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8166/15526 [2:31:15<2:16:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8167/15526 [2:31:16<2:16:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8167/15526 [2:31:16<2:16:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8168/15526 [2:31:17<2:16:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8168/15526 [2:31:17<2:16:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8169/15526 [2:31:17<2:16:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8169/15526 [2:31:17<2:16:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8170/15526 [2:31:18<2:16:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8170/15526 [2:31:18<2:16:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8171/15526 [2:31:19<2:16:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8171/15526 [2:31:19<2:16:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8172/15526 [2:31:20<2:16:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8172/15526 [2:31:20<2:16:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8173/15526 [2:31:21<2:16:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8173/15526 [2:31:21<2:16:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8174/15526 [2:31:21<2:16:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8174/15526 [2:31:21<2:16:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8175/15526 [2:31:23<2:16:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8175/15526 [2:31:23<2:16:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8176/15526 [2:31:23<2:16:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8176/15526 [2:31:23<2:16:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8177/15526 [2:31:24<2:16:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8177/15526 [2:31:24<2:16:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8178/15526 [2:31:25<2:16:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8178/15526 [2:31:25<2:16:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8179/15526 [2:31:26<2:16:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8179/15526 [2:31:26<2:16:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8180/15526 [2:31:27<2:16:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8180/15526 [2:31:27<2:16:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8181/15526 [2:31:28<2:15:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8181/15526 [2:31:28<2:15:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8182/15526 [2:31:29<2:15:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8182/15526 [2:31:29<2:15:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8183/15526 [2:31:30<2:15:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8183/15526 [2:31:30<2:15:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8184/15526 [2:31:31<2:15:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8184/15526 [2:31:31<2:15:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8185/15526 [2:31:32<2:15:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8185/15526 [2:31:32<2:15:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8186/15526 [2:31:33<2:15:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8186/15526 [2:31:33<2:15:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8187/15526 [2:31:34<2:15:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8187/15526 [2:31:34<2:15:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8188/15526 [2:31:34<2:15:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8188/15526 [2:31:34<2:15:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8189/15526 [2:31:35<2:15:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8189/15526 [2:31:35<2:15:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8190/15526 [2:31:36<2:15:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8190/15526 [2:31:36<2:15:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8191/15526 [2:31:37<2:15:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8191/15526 [2:31:37<2:15:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8192/15526 [2:31:45<2:15:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8192/15526 [2:31:45<2:15:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8193/15526 [2:31:46<2:15:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8193/15526 [2:31:46<2:15:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8194/15526 [2:31:47<2:15:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8194/15526 [2:31:47<2:15:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8195/15526 [2:31:48<2:15:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8195/15526 [2:31:48<2:15:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8196/15526 [2:31:49<2:15:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8196/15526 [2:31:49<2:15:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8197/15526 [2:31:50<2:15:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8197/15526 [2:31:50<2:15:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8198/15526 [2:31:51<2:15:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8198/15526 [2:31:51<2:15:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8199/15526 [2:31:52<2:15:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8199/15526 [2:31:52<2:15:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8200/15526 [2:31:53<2:15:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8200/15526 [2:31:53<2:15:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8201/15526 [2:31:54<2:15:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8201/15526 [2:31:54<2:15:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8202/15526 [2:31:54<2:15:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8202/15526 [2:31:54<2:15:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8203/15526 [2:31:55<2:15:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8203/15526 [2:31:55<2:15:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8204/15526 [2:31:56<2:15:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8204/15526 [2:31:56<2:15:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8205/15526 [2:31:56<2:15:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8205/15526 [2:31:56<2:15:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8206/15526 [2:31:57<2:15:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8206/15526 [2:31:57<2:15:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8207/15526 [2:31:58<2:15:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8207/15526 [2:31:58<2:15:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8208/15526 [2:31:59<2:15:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8208/15526 [2:31:59<2:15:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8209/15526 [2:32:00<2:15:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8209/15526 [2:32:00<2:15:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8210/15526 [2:32:01<2:15:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8210/15526 [2:32:01<2:15:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8211/15526 [2:32:01<2:15:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8211/15526 [2:32:01<2:15:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8212/15526 [2:32:02<2:15:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8212/15526 [2:32:02<2:15:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8213/15526 [2:32:03<2:15:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8213/15526 [2:32:03<2:15:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8214/15526 [2:32:04<2:15:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8214/15526 [2:32:04<2:15:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8215/15526 [2:32:05<2:15:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8215/15526 [2:32:05<2:15:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8216/15526 [2:32:05<2:15:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8216/15526 [2:32:05<2:15:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8217/15526 [2:32:06<2:15:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8217/15526 [2:32:06<2:15:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8218/15526 [2:32:07<2:15:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8218/15526 [2:32:07<2:15:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8219/15526 [2:32:07<2:15:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8219/15526 [2:32:07<2:15:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8220/15526 [2:32:08<2:15:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8220/15526 [2:32:08<2:15:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8221/15526 [2:32:09<2:15:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8221/15526 [2:32:09<2:15:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8222/15526 [2:32:09<2:15:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8222/15526 [2:32:09<2:15:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8223/15526 [2:32:10<2:15:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8223/15526 [2:32:10<2:15:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8224/15526 [2:32:20<2:15:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8224/15526 [2:32:20<2:15:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8225/15526 [2:32:21<2:15:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8225/15526 [2:32:21<2:15:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8226/15526 [2:32:22<2:15:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8226/15526 [2:32:22<2:15:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8227/15526 [2:32:23<2:15:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8227/15526 [2:32:23<2:15:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8228/15526 [2:32:24<2:15:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8228/15526 [2:32:24<2:15:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8229/15526 [2:32:25<2:15:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8229/15526 [2:32:25<2:15:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8230/15526 [2:32:25<2:15:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8230/15526 [2:32:25<2:15:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8231/15526 [2:32:26<2:15:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8231/15526 [2:32:26<2:15:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8232/15526 [2:32:27<2:15:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8232/15526 [2:32:27<2:15:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8233/15526 [2:32:28<2:15:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8233/15526 [2:32:28<2:15:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8234/15526 [2:32:30<2:15:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8234/15526 [2:32:30<2:15:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8235/15526 [2:32:30<2:15:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8235/15526 [2:32:30<2:15:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8236/15526 [2:32:31<2:15:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8236/15526 [2:32:31<2:15:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8237/15526 [2:32:32<2:14:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8237/15526 [2:32:32<2:14:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8238/15526 [2:32:32<2:14:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8238/15526 [2:32:32<2:14:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8239/15526 [2:32:33<2:14:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8239/15526 [2:32:33<2:14:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8240/15526 [2:32:34<2:14:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8240/15526 [2:32:34<2:14:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8241/15526 [2:32:35<2:14:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8241/15526 [2:32:35<2:14:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8242/15526 [2:32:36<2:14:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8242/15526 [2:32:36<2:14:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8243/15526 [2:32:37<2:14:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8243/15526 [2:32:37<2:14:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8244/15526 [2:32:38<2:14:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8244/15526 [2:32:38<2:14:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8245/15526 [2:32:39<2:14:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8245/15526 [2:32:39<2:14:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8246/15526 [2:32:40<2:14:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8246/15526 [2:32:40<2:14:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8247/15526 [2:32:40<2:14:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8247/15526 [2:32:40<2:14:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8248/15526 [2:32:41<2:14:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8248/15526 [2:32:41<2:14:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8249/15526 [2:32:42<2:14:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8249/15526 [2:32:42<2:14:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8250/15526 [2:32:43<2:14:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8250/15526 [2:32:43<2:14:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8251/15526 [2:32:44<2:14:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8251/15526 [2:32:44<2:14:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8252/15526 [2:32:45<2:14:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8252/15526 [2:32:45<2:14:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8253/15526 [2:32:45<2:14:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8253/15526 [2:32:45<2:14:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8254/15526 [2:32:46<2:14:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8254/15526 [2:32:46<2:14:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8255/15526 [2:32:47<2:14:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8255/15526 [2:32:47<2:14:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8256/15526 [2:32:55<2:14:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8256/15526 [2:32:55<2:14:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8257/15526 [2:32:55<2:14:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8257/15526 [2:32:55<2:14:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8258/15526 [2:32:57<2:14:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8258/15526 [2:32:57<2:14:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8259/15526 [2:32:58<2:14:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8259/15526 [2:32:58<2:14:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8260/15526 [2:32:58<2:14:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8260/15526 [2:32:58<2:14:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8261/15526 [2:32:59<2:14:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8261/15526 [2:32:59<2:14:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8262/15526 [2:33:00<2:14:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8262/15526 [2:33:00<2:14:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8263/15526 [2:33:01<2:14:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8263/15526 [2:33:01<2:14:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8264/15526 [2:33:02<2:14:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8264/15526 [2:33:02<2:14:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8265/15526 [2:33:02<2:14:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8265/15526 [2:33:02<2:14:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8266/15526 [2:33:03<2:14:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8266/15526 [2:33:03<2:14:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8267/15526 [2:33:04<2:14:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8267/15526 [2:33:04<2:14:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8268/15526 [2:33:04<2:14:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8268/15526 [2:33:04<2:14:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8269/15526 [2:33:05<2:14:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8269/15526 [2:33:05<2:14:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8270/15526 [2:33:07<2:14:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8270/15526 [2:33:07<2:14:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8271/15526 [2:33:07<2:14:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8271/15526 [2:33:07<2:14:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8272/15526 [2:33:09<2:14:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8272/15526 [2:33:09<2:14:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8273/15526 [2:33:10<2:14:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8273/15526 [2:33:10<2:14:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8274/15526 [2:33:11<2:14:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8274/15526 [2:33:11<2:14:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8275/15526 [2:33:12<2:14:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8275/15526 [2:33:12<2:14:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8276/15526 [2:33:13<2:14:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8276/15526 [2:33:13<2:14:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8277/15526 [2:33:13<2:14:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8277/15526 [2:33:13<2:14:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8278/15526 [2:33:14<2:14:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8278/15526 [2:33:14<2:14:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8279/15526 [2:33:15<2:14:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8279/15526 [2:33:15<2:14:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8280/15526 [2:33:16<2:14:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8280/15526 [2:33:16<2:14:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8281/15526 [2:33:17<2:14:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8281/15526 [2:33:17<2:14:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8282/15526 [2:33:18<2:14:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8282/15526 [2:33:18<2:14:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8283/15526 [2:33:18<2:14:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8283/15526 [2:33:18<2:14:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8284/15526 [2:33:19<2:14:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8284/15526 [2:33:19<2:14:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8285/15526 [2:33:20<2:14:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8285/15526 [2:33:20<2:14:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8286/15526 [2:33:20<2:13:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8286/15526 [2:33:20<2:13:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8287/15526 [2:33:22<2:13:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8287/15526 [2:33:22<2:13:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8288/15526 [2:33:29<2:14:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8288/15526 [2:33:29<2:14:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8289/15526 [2:33:29<2:14:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8289/15526 [2:33:29<2:14:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8290/15526 [2:33:31<2:13:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8290/15526 [2:33:31<2:13:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8291/15526 [2:33:32<2:13:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8291/15526 [2:33:32<2:13:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8292/15526 [2:33:33<2:13:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8292/15526 [2:33:33<2:13:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8293/15526 [2:33:34<2:13:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8293/15526 [2:33:34<2:13:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8294/15526 [2:33:35<2:13:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8294/15526 [2:33:35<2:13:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8295/15526 [2:33:36<2:13:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8295/15526 [2:33:36<2:13:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8296/15526 [2:33:37<2:13:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8296/15526 [2:33:37<2:13:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8297/15526 [2:33:38<2:13:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8297/15526 [2:33:38<2:13:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8298/15526 [2:33:39<2:13:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8298/15526 [2:33:39<2:13:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8299/15526 [2:33:40<2:13:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8299/15526 [2:33:40<2:13:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8300/15526 [2:33:40<2:13:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8300/15526 [2:33:40<2:13:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8301/15526 [2:33:41<2:13:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8301/15526 [2:33:41<2:13:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8302/15526 [2:33:42<2:13:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8302/15526 [2:33:42<2:13:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8303/15526 [2:33:42<2:13:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8303/15526 [2:33:42<2:13:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8304/15526 [2:33:43<2:13:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8304/15526 [2:33:43<2:13:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8305/15526 [2:33:44<2:13:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8305/15526 [2:33:44<2:13:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 8306/15526 [2:33:45<2:13:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  53%|▌| 8306/15526 [2:33:45<2:13:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8307/15526 [2:33:46<2:13:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8307/15526 [2:33:46<2:13:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8308/15526 [2:33:47<2:13:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8308/15526 [2:33:47<2:13:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8309/15526 [2:33:48<2:13:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8309/15526 [2:33:48<2:13:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8310/15526 [2:33:49<2:13:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8310/15526 [2:33:49<2:13:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8311/15526 [2:33:50<2:13:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8311/15526 [2:33:50<2:13:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8312/15526 [2:33:50<2:13:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8312/15526 [2:33:50<2:13:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8313/15526 [2:33:51<2:13:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8313/15526 [2:33:51<2:13:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8314/15526 [2:33:52<2:13:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8314/15526 [2:33:52<2:13:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8315/15526 [2:33:53<2:13:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8315/15526 [2:33:53<2:13:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8316/15526 [2:33:54<2:13:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8316/15526 [2:33:54<2:13:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8317/15526 [2:33:55<2:13:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8317/15526 [2:33:55<2:13:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8318/15526 [2:33:56<2:13:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8318/15526 [2:33:56<2:13:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8319/15526 [2:33:57<2:13:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8319/15526 [2:33:57<2:13:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8320/15526 [2:34:04<2:13:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8320/15526 [2:34:04<2:13:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8321/15526 [2:34:05<2:13:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8321/15526 [2:34:05<2:13:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8322/15526 [2:34:06<2:13:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8322/15526 [2:34:06<2:13:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8323/15526 [2:34:07<2:13:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8323/15526 [2:34:07<2:13:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8324/15526 [2:34:08<2:13:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8324/15526 [2:34:08<2:13:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8325/15526 [2:34:09<2:13:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8325/15526 [2:34:09<2:13:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8326/15526 [2:34:09<2:13:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8326/15526 [2:34:09<2:13:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8327/15526 [2:34:11<2:13:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8327/15526 [2:34:11<2:13:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8328/15526 [2:34:11<2:13:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8328/15526 [2:34:11<2:13:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8329/15526 [2:34:12<2:13:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8329/15526 [2:34:12<2:13:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8330/15526 [2:34:13<2:13:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8330/15526 [2:34:13<2:13:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8331/15526 [2:34:13<2:13:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8331/15526 [2:34:13<2:13:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8332/15526 [2:34:14<2:13:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8332/15526 [2:34:14<2:13:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8333/15526 [2:34:15<2:13:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8333/15526 [2:34:15<2:13:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8334/15526 [2:34:16<2:13:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8334/15526 [2:34:16<2:13:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8335/15526 [2:34:17<2:13:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8335/15526 [2:34:17<2:13:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8336/15526 [2:34:18<2:13:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8336/15526 [2:34:18<2:13:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8337/15526 [2:34:19<2:13:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8337/15526 [2:34:19<2:13:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8338/15526 [2:34:20<2:13:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8338/15526 [2:34:20<2:13:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8339/15526 [2:34:21<2:13:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8339/15526 [2:34:21<2:13:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8340/15526 [2:34:21<2:13:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8340/15526 [2:34:21<2:13:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8341/15526 [2:34:22<2:12:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8341/15526 [2:34:22<2:12:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8342/15526 [2:34:23<2:12:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8342/15526 [2:34:23<2:12:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8343/15526 [2:34:24<2:12:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8343/15526 [2:34:24<2:12:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8344/15526 [2:34:25<2:12:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8344/15526 [2:34:25<2:12:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8345/15526 [2:34:25<2:12:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8345/15526 [2:34:25<2:12:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8346/15526 [2:34:27<2:12:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8346/15526 [2:34:27<2:12:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8347/15526 [2:34:28<2:12:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8347/15526 [2:34:28<2:12:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8348/15526 [2:34:29<2:12:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8348/15526 [2:34:29<2:12:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8349/15526 [2:34:30<2:12:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8349/15526 [2:34:30<2:12:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8350/15526 [2:34:30<2:12:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8350/15526 [2:34:30<2:12:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8351/15526 [2:34:31<2:12:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8351/15526 [2:34:31<2:12:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8352/15526 [2:34:38<2:12:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8352/15526 [2:34:38<2:12:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8353/15526 [2:34:39<2:12:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8353/15526 [2:34:39<2:12:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8354/15526 [2:34:39<2:12:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8354/15526 [2:34:39<2:12:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8355/15526 [2:34:41<2:12:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8355/15526 [2:34:41<2:12:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8356/15526 [2:34:41<2:12:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8356/15526 [2:34:41<2:12:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8357/15526 [2:34:43<2:12:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8357/15526 [2:34:43<2:12:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8358/15526 [2:34:43<2:12:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8358/15526 [2:34:43<2:12:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8359/15526 [2:34:44<2:12:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8359/15526 [2:34:44<2:12:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8360/15526 [2:34:45<2:12:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8360/15526 [2:34:45<2:12:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8361/15526 [2:34:46<2:12:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8361/15526 [2:34:46<2:12:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8362/15526 [2:34:47<2:12:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8362/15526 [2:34:47<2:12:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8363/15526 [2:34:48<2:12:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8363/15526 [2:34:48<2:12:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8364/15526 [2:34:49<2:12:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8364/15526 [2:34:49<2:12:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8365/15526 [2:34:49<2:12:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8365/15526 [2:34:49<2:12:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8366/15526 [2:34:51<2:12:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8366/15526 [2:34:51<2:12:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8367/15526 [2:34:52<2:12:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8367/15526 [2:34:52<2:12:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8368/15526 [2:34:53<2:12:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8368/15526 [2:34:53<2:12:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8369/15526 [2:34:53<2:12:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8369/15526 [2:34:53<2:12:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8370/15526 [2:34:54<2:12:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8370/15526 [2:34:54<2:12:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8371/15526 [2:34:55<2:12:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8371/15526 [2:34:55<2:12:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8372/15526 [2:34:55<2:12:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8372/15526 [2:34:55<2:12:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8373/15526 [2:34:56<2:12:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8373/15526 [2:34:56<2:12:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8374/15526 [2:34:58<2:12:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8374/15526 [2:34:58<2:12:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8375/15526 [2:34:59<2:12:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8375/15526 [2:34:59<2:12:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8376/15526 [2:35:00<2:12:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8376/15526 [2:35:00<2:12:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8377/15526 [2:35:01<2:12:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8377/15526 [2:35:01<2:12:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8378/15526 [2:35:01<2:12:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8378/15526 [2:35:01<2:12:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8379/15526 [2:35:02<2:12:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8379/15526 [2:35:02<2:12:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8380/15526 [2:35:03<2:12:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8380/15526 [2:35:03<2:12:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8381/15526 [2:35:04<2:12:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8381/15526 [2:35:04<2:12:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8382/15526 [2:35:04<2:12:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8382/15526 [2:35:04<2:12:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8383/15526 [2:35:05<2:12:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8383/15526 [2:35:05<2:12:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8384/15526 [2:35:14<2:12:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8384/15526 [2:35:14<2:12:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8385/15526 [2:35:15<2:12:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8385/15526 [2:35:15<2:12:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8386/15526 [2:35:15<2:12:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8386/15526 [2:35:15<2:12:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8387/15526 [2:35:16<2:12:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8387/15526 [2:35:16<2:12:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8388/15526 [2:35:17<2:12:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8388/15526 [2:35:17<2:12:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8389/15526 [2:35:18<2:12:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8389/15526 [2:35:18<2:12:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8390/15526 [2:35:19<2:12:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8390/15526 [2:35:19<2:12:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8391/15526 [2:35:20<2:12:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8391/15526 [2:35:20<2:12:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8392/15526 [2:35:20<2:12:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8392/15526 [2:35:20<2:12:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8393/15526 [2:35:21<2:12:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8393/15526 [2:35:21<2:12:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8394/15526 [2:35:22<2:12:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8394/15526 [2:35:22<2:12:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8395/15526 [2:35:23<2:11:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8395/15526 [2:35:23<2:11:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8396/15526 [2:35:24<2:11:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8396/15526 [2:35:24<2:11:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8397/15526 [2:35:24<2:11:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8397/15526 [2:35:24<2:11:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8398/15526 [2:35:25<2:11:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8398/15526 [2:35:25<2:11:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8399/15526 [2:35:26<2:11:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8399/15526 [2:35:26<2:11:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8400/15526 [2:35:26<2:11:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8400/15526 [2:35:26<2:11:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8401/15526 [2:35:27<2:11:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8401/15526 [2:35:27<2:11:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8402/15526 [2:35:28<2:11:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8402/15526 [2:35:28<2:11:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8403/15526 [2:35:29<2:11:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8403/15526 [2:35:29<2:11:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8404/15526 [2:35:29<2:11:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8404/15526 [2:35:29<2:11:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8405/15526 [2:35:31<2:11:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8405/15526 [2:35:31<2:11:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8406/15526 [2:35:32<2:11:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8406/15526 [2:35:32<2:11:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8407/15526 [2:35:33<2:11:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8407/15526 [2:35:33<2:11:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8408/15526 [2:35:34<2:11:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8408/15526 [2:35:34<2:11:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8409/15526 [2:35:35<2:11:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8409/15526 [2:35:35<2:11:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8410/15526 [2:35:35<2:11:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8410/15526 [2:35:35<2:11:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8411/15526 [2:35:37<2:11:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8411/15526 [2:35:37<2:11:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8412/15526 [2:35:37<2:11:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8412/15526 [2:35:37<2:11:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8413/15526 [2:35:38<2:11:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8413/15526 [2:35:38<2:11:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8414/15526 [2:35:40<2:11:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8414/15526 [2:35:40<2:11:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8415/15526 [2:35:41<2:11:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8415/15526 [2:35:41<2:11:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8416/15526 [2:35:47<2:11:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8416/15526 [2:35:47<2:11:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8417/15526 [2:35:48<2:11:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8417/15526 [2:35:48<2:11:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8418/15526 [2:35:49<2:11:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8418/15526 [2:35:49<2:11:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8419/15526 [2:35:50<2:11:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8419/15526 [2:35:50<2:11:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8420/15526 [2:35:51<2:11:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8420/15526 [2:35:51<2:11:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8421/15526 [2:35:52<2:11:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8421/15526 [2:35:52<2:11:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8422/15526 [2:35:52<2:11:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8422/15526 [2:35:52<2:11:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8423/15526 [2:35:54<2:11:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8423/15526 [2:35:54<2:11:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8424/15526 [2:35:54<2:11:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8424/15526 [2:35:54<2:11:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8425/15526 [2:35:55<2:11:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8425/15526 [2:35:55<2:11:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8426/15526 [2:35:56<2:11:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8426/15526 [2:35:56<2:11:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8427/15526 [2:35:57<2:11:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8427/15526 [2:35:57<2:11:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8428/15526 [2:35:57<2:11:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8428/15526 [2:35:57<2:11:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8429/15526 [2:35:59<2:11:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8429/15526 [2:35:59<2:11:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8430/15526 [2:35:59<2:11:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8430/15526 [2:35:59<2:11:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8431/15526 [2:36:00<2:11:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8431/15526 [2:36:00<2:11:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8432/15526 [2:36:01<2:11:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8432/15526 [2:36:01<2:11:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8433/15526 [2:36:02<2:11:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8433/15526 [2:36:02<2:11:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8434/15526 [2:36:03<2:11:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8434/15526 [2:36:03<2:11:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8435/15526 [2:36:04<2:11:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8435/15526 [2:36:04<2:11:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8436/15526 [2:36:04<2:11:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8436/15526 [2:36:04<2:11:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8437/15526 [2:36:05<2:11:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8437/15526 [2:36:05<2:11:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8438/15526 [2:36:06<2:11:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8438/15526 [2:36:06<2:11:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8439/15526 [2:36:06<2:11:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8439/15526 [2:36:06<2:11:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8440/15526 [2:36:07<2:11:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8440/15526 [2:36:07<2:11:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8441/15526 [2:36:09<2:11:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8441/15526 [2:36:09<2:11:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8442/15526 [2:36:09<2:11:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8442/15526 [2:36:09<2:11:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8443/15526 [2:36:10<2:11:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8443/15526 [2:36:10<2:11:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8444/15526 [2:36:11<2:10:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8444/15526 [2:36:11<2:10:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8445/15526 [2:36:12<2:10:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8445/15526 [2:36:12<2:10:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8446/15526 [2:36:12<2:10:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8446/15526 [2:36:12<2:10:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8447/15526 [2:36:13<2:10:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8447/15526 [2:36:13<2:10:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8448/15526 [2:36:22<2:11:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8448/15526 [2:36:22<2:11:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8449/15526 [2:36:24<2:11:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8449/15526 [2:36:24<2:11:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8450/15526 [2:36:24<2:10:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8450/15526 [2:36:24<2:10:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8451/15526 [2:36:25<2:10:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8451/15526 [2:36:25<2:10:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8452/15526 [2:36:26<2:10:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8452/15526 [2:36:26<2:10:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8453/15526 [2:36:27<2:10:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8453/15526 [2:36:27<2:10:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8454/15526 [2:36:27<2:10:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8454/15526 [2:36:27<2:10:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8455/15526 [2:36:28<2:10:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8455/15526 [2:36:28<2:10:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8456/15526 [2:36:29<2:10:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8456/15526 [2:36:29<2:10:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8457/15526 [2:36:30<2:10:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8457/15526 [2:36:30<2:10:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8458/15526 [2:36:31<2:10:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8458/15526 [2:36:31<2:10:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8459/15526 [2:36:31<2:10:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8459/15526 [2:36:31<2:10:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8460/15526 [2:36:32<2:10:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8460/15526 [2:36:32<2:10:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 8461/15526 [2:36:33<2:10:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  54%|▌| 8461/15526 [2:36:33<2:10:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8462/15526 [2:36:34<2:10:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8462/15526 [2:36:34<2:10:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8463/15526 [2:36:34<2:10:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8463/15526 [2:36:34<2:10:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8464/15526 [2:36:36<2:10:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8464/15526 [2:36:36<2:10:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8465/15526 [2:36:36<2:10:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8465/15526 [2:36:36<2:10:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8466/15526 [2:36:37<2:10:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8466/15526 [2:36:37<2:10:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8467/15526 [2:36:38<2:10:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8467/15526 [2:36:38<2:10:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8468/15526 [2:36:39<2:10:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8468/15526 [2:36:39<2:10:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8469/15526 [2:36:39<2:10:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8469/15526 [2:36:39<2:10:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8470/15526 [2:36:40<2:10:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8470/15526 [2:36:40<2:10:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8471/15526 [2:36:41<2:10:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8471/15526 [2:36:41<2:10:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8472/15526 [2:36:42<2:10:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8472/15526 [2:36:42<2:10:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8473/15526 [2:36:43<2:10:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8473/15526 [2:36:43<2:10:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8474/15526 [2:36:43<2:10:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8474/15526 [2:36:43<2:10:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8475/15526 [2:36:45<2:10:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8475/15526 [2:36:45<2:10:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8476/15526 [2:36:45<2:10:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8476/15526 [2:36:45<2:10:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8477/15526 [2:36:47<2:10:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8477/15526 [2:36:47<2:10:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8478/15526 [2:36:47<2:10:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8478/15526 [2:36:47<2:10:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8479/15526 [2:36:48<2:10:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8479/15526 [2:36:48<2:10:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8480/15526 [2:36:57<2:10:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8480/15526 [2:36:57<2:10:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8481/15526 [2:36:57<2:10:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8481/15526 [2:36:57<2:10:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8482/15526 [2:36:58<2:10:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8482/15526 [2:36:58<2:10:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8483/15526 [2:36:59<2:10:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8483/15526 [2:36:59<2:10:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8484/15526 [2:37:00<2:10:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8484/15526 [2:37:00<2:10:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8485/15526 [2:37:00<2:10:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8485/15526 [2:37:00<2:10:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8486/15526 [2:37:02<2:10:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8486/15526 [2:37:02<2:10:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8487/15526 [2:37:02<2:10:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8487/15526 [2:37:02<2:10:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8488/15526 [2:37:03<2:10:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8488/15526 [2:37:03<2:10:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8489/15526 [2:37:04<2:10:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8489/15526 [2:37:04<2:10:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8490/15526 [2:37:04<2:10:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8490/15526 [2:37:04<2:10:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8491/15526 [2:37:05<2:10:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8491/15526 [2:37:05<2:10:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8492/15526 [2:37:06<2:10:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8492/15526 [2:37:06<2:10:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8493/15526 [2:37:06<2:10:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8493/15526 [2:37:06<2:10:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8494/15526 [2:37:07<2:10:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8494/15526 [2:37:07<2:10:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8495/15526 [2:37:08<2:10:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8495/15526 [2:37:08<2:10:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8496/15526 [2:37:08<2:10:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8496/15526 [2:37:08<2:10:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8497/15526 [2:37:09<2:10:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8497/15526 [2:37:09<2:10:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8498/15526 [2:37:10<2:09:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8498/15526 [2:37:10<2:09:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8499/15526 [2:37:10<2:09:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8499/15526 [2:37:10<2:09:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8500/15526 [2:37:11<2:09:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8500/15526 [2:37:11<2:09:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8501/15526 [2:37:12<2:09:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8501/15526 [2:37:12<2:09:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8502/15526 [2:37:13<2:09:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8502/15526 [2:37:13<2:09:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8503/15526 [2:37:14<2:09:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8503/15526 [2:37:14<2:09:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8504/15526 [2:37:14<2:09:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8504/15526 [2:37:14<2:09:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8505/15526 [2:37:15<2:09:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8505/15526 [2:37:15<2:09:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8506/15526 [2:37:16<2:09:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8506/15526 [2:37:16<2:09:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8507/15526 [2:37:17<2:09:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8507/15526 [2:37:17<2:09:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8508/15526 [2:37:18<2:09:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8508/15526 [2:37:18<2:09:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8509/15526 [2:37:19<2:09:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8509/15526 [2:37:19<2:09:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8510/15526 [2:37:20<2:09:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8510/15526 [2:37:20<2:09:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8511/15526 [2:37:21<2:09:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8511/15526 [2:37:21<2:09:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8512/15526 [2:37:32<2:09:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8512/15526 [2:37:32<2:09:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8513/15526 [2:37:33<2:09:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8513/15526 [2:37:33<2:09:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8514/15526 [2:37:33<2:09:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8514/15526 [2:37:33<2:09:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8515/15526 [2:37:34<2:09:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8515/15526 [2:37:34<2:09:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8516/15526 [2:37:35<2:09:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8516/15526 [2:37:35<2:09:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8517/15526 [2:37:36<2:09:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8517/15526 [2:37:36<2:09:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8518/15526 [2:37:37<2:09:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8518/15526 [2:37:37<2:09:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8519/15526 [2:37:38<2:09:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8519/15526 [2:37:38<2:09:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8520/15526 [2:37:39<2:09:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8520/15526 [2:37:39<2:09:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8521/15526 [2:37:40<2:09:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8521/15526 [2:37:40<2:09:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8522/15526 [2:37:40<2:09:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8522/15526 [2:37:40<2:09:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8523/15526 [2:37:41<2:09:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8523/15526 [2:37:41<2:09:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8524/15526 [2:37:42<2:09:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8524/15526 [2:37:42<2:09:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8525/15526 [2:37:43<2:09:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8525/15526 [2:37:43<2:09:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8526/15526 [2:37:44<2:09:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8526/15526 [2:37:44<2:09:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8527/15526 [2:37:45<2:09:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8527/15526 [2:37:45<2:09:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8528/15526 [2:37:46<2:09:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8528/15526 [2:37:46<2:09:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8529/15526 [2:37:47<2:09:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8529/15526 [2:37:47<2:09:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8530/15526 [2:37:47<2:09:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8530/15526 [2:37:47<2:09:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8531/15526 [2:37:48<2:09:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8531/15526 [2:37:48<2:09:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8532/15526 [2:37:49<2:09:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8532/15526 [2:37:49<2:09:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8533/15526 [2:37:50<2:09:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8533/15526 [2:37:50<2:09:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8534/15526 [2:37:50<2:09:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8534/15526 [2:37:50<2:09:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8535/15526 [2:37:52<2:09:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8535/15526 [2:37:52<2:09:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8536/15526 [2:37:53<2:09:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8536/15526 [2:37:53<2:09:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8537/15526 [2:37:53<2:09:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8537/15526 [2:37:54<2:09:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8538/15526 [2:37:54<2:09:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8538/15526 [2:37:54<2:09:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8539/15526 [2:37:55<2:09:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8539/15526 [2:37:55<2:09:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8540/15526 [2:37:56<2:09:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8540/15526 [2:37:56<2:09:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8541/15526 [2:37:57<2:09:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8541/15526 [2:37:57<2:09:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8542/15526 [2:37:57<2:09:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8542/15526 [2:37:57<2:09:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8543/15526 [2:37:58<2:09:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8543/15526 [2:37:58<2:09:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8544/15526 [2:38:06<2:09:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8544/15526 [2:38:06<2:09:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8545/15526 [2:38:06<2:09:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8545/15526 [2:38:06<2:09:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8546/15526 [2:38:08<2:09:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8546/15526 [2:38:08<2:09:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8547/15526 [2:38:09<2:09:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8547/15526 [2:38:09<2:09:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8548/15526 [2:38:10<2:09:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8548/15526 [2:38:10<2:09:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8549/15526 [2:38:10<2:09:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8549/15526 [2:38:10<2:09:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8550/15526 [2:38:11<2:09:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8550/15526 [2:38:11<2:09:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8551/15526 [2:38:12<2:09:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8551/15526 [2:38:12<2:09:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8552/15526 [2:38:12<2:09:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8552/15526 [2:38:12<2:09:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8553/15526 [2:38:13<2:08:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8553/15526 [2:38:13<2:08:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8554/15526 [2:38:14<2:08:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8554/15526 [2:38:14<2:08:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8555/15526 [2:38:15<2:08:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8555/15526 [2:38:15<2:08:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8556/15526 [2:38:16<2:08:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8556/15526 [2:38:16<2:08:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8557/15526 [2:38:17<2:08:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8557/15526 [2:38:17<2:08:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8558/15526 [2:38:17<2:08:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8558/15526 [2:38:17<2:08:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8559/15526 [2:38:18<2:08:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8559/15526 [2:38:18<2:08:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8560/15526 [2:38:19<2:08:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8560/15526 [2:38:19<2:08:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8561/15526 [2:38:19<2:08:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8561/15526 [2:38:19<2:08:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8562/15526 [2:38:20<2:08:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8562/15526 [2:38:20<2:08:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8563/15526 [2:38:21<2:08:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8563/15526 [2:38:21<2:08:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8564/15526 [2:38:21<2:08:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8564/15526 [2:38:21<2:08:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8565/15526 [2:38:22<2:08:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8565/15526 [2:38:22<2:08:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8566/15526 [2:38:24<2:08:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8566/15526 [2:38:24<2:08:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8567/15526 [2:38:24<2:08:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8567/15526 [2:38:24<2:08:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8568/15526 [2:38:25<2:08:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8568/15526 [2:38:25<2:08:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8569/15526 [2:38:26<2:08:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8569/15526 [2:38:26<2:08:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8570/15526 [2:38:27<2:08:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8570/15526 [2:38:27<2:08:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8571/15526 [2:38:28<2:08:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8571/15526 [2:38:28<2:08:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8572/15526 [2:38:29<2:08:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8572/15526 [2:38:29<2:08:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8573/15526 [2:38:29<2:08:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8573/15526 [2:38:29<2:08:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8574/15526 [2:38:31<2:08:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8574/15526 [2:38:31<2:08:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8575/15526 [2:38:32<2:08:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8575/15526 [2:38:32<2:08:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8576/15526 [2:38:40<2:08:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8576/15526 [2:38:40<2:08:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8577/15526 [2:38:41<2:08:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8577/15526 [2:38:41<2:08:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8578/15526 [2:38:42<2:08:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8578/15526 [2:38:42<2:08:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8579/15526 [2:38:43<2:08:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8579/15526 [2:38:43<2:08:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8580/15526 [2:38:43<2:08:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8580/15526 [2:38:43<2:08:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8581/15526 [2:38:44<2:08:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8581/15526 [2:38:44<2:08:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8582/15526 [2:38:44<2:08:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8582/15526 [2:38:44<2:08:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8583/15526 [2:38:46<2:08:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8583/15526 [2:38:46<2:08:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8584/15526 [2:38:46<2:08:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8584/15526 [2:38:46<2:08:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8585/15526 [2:38:47<2:08:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8585/15526 [2:38:47<2:08:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8586/15526 [2:38:48<2:08:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8586/15526 [2:38:48<2:08:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8587/15526 [2:38:49<2:08:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8587/15526 [2:38:49<2:08:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8588/15526 [2:38:50<2:08:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8588/15526 [2:38:50<2:08:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8589/15526 [2:38:51<2:08:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8589/15526 [2:38:51<2:08:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8590/15526 [2:38:52<2:08:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8590/15526 [2:38:52<2:08:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8591/15526 [2:38:53<2:08:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8591/15526 [2:38:53<2:08:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8592/15526 [2:38:54<2:08:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8592/15526 [2:38:54<2:08:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8593/15526 [2:38:55<2:08:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8593/15526 [2:38:55<2:08:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8594/15526 [2:38:55<2:08:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8594/15526 [2:38:55<2:08:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8595/15526 [2:38:56<2:08:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8595/15526 [2:38:56<2:08:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8596/15526 [2:38:57<2:08:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8596/15526 [2:38:57<2:08:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8597/15526 [2:38:57<2:08:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8597/15526 [2:38:57<2:08:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8598/15526 [2:38:58<2:08:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8598/15526 [2:38:58<2:08:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8599/15526 [2:38:59<2:08:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8599/15526 [2:38:59<2:08:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8600/15526 [2:39:00<2:08:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8600/15526 [2:39:00<2:08:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8601/15526 [2:39:02<2:08:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8601/15526 [2:39:02<2:08:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8602/15526 [2:39:02<2:08:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8602/15526 [2:39:02<2:08:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8603/15526 [2:39:03<2:07:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8603/15526 [2:39:03<2:07:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8604/15526 [2:39:04<2:07:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8604/15526 [2:39:04<2:07:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8605/15526 [2:39:05<2:07:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8605/15526 [2:39:05<2:07:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8606/15526 [2:39:05<2:07:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8606/15526 [2:39:05<2:07:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8607/15526 [2:39:06<2:07:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8607/15526 [2:39:06<2:07:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8608/15526 [2:39:16<2:08:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8608/15526 [2:39:16<2:08:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8609/15526 [2:39:17<2:07:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8609/15526 [2:39:17<2:07:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8610/15526 [2:39:18<2:07:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8610/15526 [2:39:18<2:07:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8611/15526 [2:39:19<2:07:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8611/15526 [2:39:19<2:07:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8612/15526 [2:39:19<2:07:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8612/15526 [2:39:19<2:07:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8613/15526 [2:39:20<2:07:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8613/15526 [2:39:20<2:07:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8614/15526 [2:39:21<2:07:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8614/15526 [2:39:21<2:07:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8615/15526 [2:39:21<2:07:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8615/15526 [2:39:21<2:07:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 8616/15526 [2:39:23<2:07:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  55%|▌| 8616/15526 [2:39:23<2:07:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8617/15526 [2:39:23<2:07:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8617/15526 [2:39:23<2:07:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8618/15526 [2:39:24<2:07:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8618/15526 [2:39:24<2:07:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8619/15526 [2:39:25<2:07:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8619/15526 [2:39:25<2:07:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8620/15526 [2:39:25<2:07:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8620/15526 [2:39:25<2:07:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8621/15526 [2:39:26<2:07:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8621/15526 [2:39:26<2:07:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8622/15526 [2:39:27<2:07:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8622/15526 [2:39:27<2:07:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8623/15526 [2:39:28<2:07:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8623/15526 [2:39:28<2:07:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8624/15526 [2:39:29<2:07:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8624/15526 [2:39:29<2:07:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8625/15526 [2:39:30<2:07:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8625/15526 [2:39:30<2:07:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8626/15526 [2:39:31<2:07:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8626/15526 [2:39:31<2:07:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8627/15526 [2:39:32<2:07:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8627/15526 [2:39:32<2:07:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8628/15526 [2:39:33<2:07:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8628/15526 [2:39:33<2:07:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8629/15526 [2:39:33<2:07:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8629/15526 [2:39:33<2:07:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8630/15526 [2:39:34<2:07:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8630/15526 [2:39:34<2:07:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8631/15526 [2:39:35<2:07:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8631/15526 [2:39:35<2:07:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8632/15526 [2:39:36<2:07:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8632/15526 [2:39:36<2:07:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8633/15526 [2:39:37<2:07:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8633/15526 [2:39:37<2:07:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8634/15526 [2:39:37<2:07:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8634/15526 [2:39:37<2:07:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8635/15526 [2:39:38<2:07:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8635/15526 [2:39:38<2:07:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8636/15526 [2:39:39<2:07:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8636/15526 [2:39:39<2:07:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8637/15526 [2:39:40<2:07:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8637/15526 [2:39:40<2:07:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8638/15526 [2:39:41<2:07:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8638/15526 [2:39:41<2:07:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8639/15526 [2:39:42<2:07:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8639/15526 [2:39:42<2:07:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8640/15526 [2:39:50<2:07:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8640/15526 [2:39:50<2:07:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8641/15526 [2:39:51<2:07:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8641/15526 [2:39:51<2:07:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8642/15526 [2:39:52<2:07:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8642/15526 [2:39:52<2:07:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8643/15526 [2:39:53<2:07:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8643/15526 [2:39:53<2:07:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8644/15526 [2:39:54<2:07:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8644/15526 [2:39:54<2:07:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8645/15526 [2:39:54<2:07:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8645/15526 [2:39:54<2:07:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8646/15526 [2:39:55<2:07:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8646/15526 [2:39:55<2:07:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8647/15526 [2:39:56<2:07:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8647/15526 [2:39:56<2:07:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8648/15526 [2:39:57<2:07:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8648/15526 [2:39:57<2:07:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8649/15526 [2:39:58<2:07:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8649/15526 [2:39:58<2:07:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8650/15526 [2:39:59<2:07:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8650/15526 [2:39:59<2:07:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8651/15526 [2:40:00<2:07:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8651/15526 [2:40:00<2:07:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8652/15526 [2:40:00<2:07:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8652/15526 [2:40:00<2:07:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8653/15526 [2:40:01<2:07:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8653/15526 [2:40:01<2:07:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8654/15526 [2:40:02<2:07:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8654/15526 [2:40:02<2:07:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8655/15526 [2:40:03<2:07:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8655/15526 [2:40:03<2:07:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8656/15526 [2:40:04<2:07:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8656/15526 [2:40:04<2:07:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8657/15526 [2:40:05<2:07:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8657/15526 [2:40:05<2:07:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8658/15526 [2:40:06<2:07:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8658/15526 [2:40:06<2:07:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8659/15526 [2:40:07<2:06:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8659/15526 [2:40:07<2:06:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8660/15526 [2:40:08<2:06:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8660/15526 [2:40:08<2:06:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8661/15526 [2:40:09<2:06:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8661/15526 [2:40:09<2:06:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8662/15526 [2:40:10<2:06:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8662/15526 [2:40:10<2:06:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8663/15526 [2:40:11<2:06:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8663/15526 [2:40:11<2:06:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8664/15526 [2:40:11<2:06:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8664/15526 [2:40:11<2:06:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8665/15526 [2:40:12<2:06:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8665/15526 [2:40:12<2:06:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8666/15526 [2:40:13<2:06:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8666/15526 [2:40:13<2:06:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8667/15526 [2:40:14<2:06:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8667/15526 [2:40:14<2:06:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8668/15526 [2:40:14<2:06:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8668/15526 [2:40:14<2:06:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8669/15526 [2:40:15<2:06:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8669/15526 [2:40:15<2:06:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8670/15526 [2:40:16<2:06:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8670/15526 [2:40:16<2:06:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8671/15526 [2:40:17<2:06:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8671/15526 [2:40:17<2:06:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8672/15526 [2:40:25<2:06:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8672/15526 [2:40:25<2:06:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8673/15526 [2:40:26<2:06:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8673/15526 [2:40:26<2:06:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8674/15526 [2:40:26<2:06:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8674/15526 [2:40:26<2:06:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8675/15526 [2:40:27<2:06:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8675/15526 [2:40:27<2:06:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8676/15526 [2:40:28<2:06:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8676/15526 [2:40:28<2:06:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8677/15526 [2:40:28<2:06:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8677/15526 [2:40:28<2:06:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8678/15526 [2:40:29<2:06:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8678/15526 [2:40:29<2:06:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8679/15526 [2:40:30<2:06:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8679/15526 [2:40:30<2:06:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8680/15526 [2:40:30<2:06:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8680/15526 [2:40:30<2:06:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8681/15526 [2:40:31<2:06:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8681/15526 [2:40:31<2:06:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8682/15526 [2:40:32<2:06:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8682/15526 [2:40:32<2:06:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8683/15526 [2:40:34<2:06:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8683/15526 [2:40:34<2:06:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8684/15526 [2:40:34<2:06:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8684/15526 [2:40:34<2:06:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8685/15526 [2:40:35<2:06:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8685/15526 [2:40:35<2:06:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8686/15526 [2:40:37<2:06:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8686/15526 [2:40:37<2:06:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8687/15526 [2:40:37<2:06:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8687/15526 [2:40:37<2:06:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8688/15526 [2:40:38<2:06:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8688/15526 [2:40:38<2:06:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8689/15526 [2:40:39<2:06:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8689/15526 [2:40:39<2:06:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8690/15526 [2:40:40<2:06:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8690/15526 [2:40:40<2:06:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8691/15526 [2:40:41<2:06:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8691/15526 [2:40:41<2:06:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8692/15526 [2:40:42<2:06:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8692/15526 [2:40:42<2:06:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8693/15526 [2:40:43<2:06:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8693/15526 [2:40:43<2:06:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8694/15526 [2:40:43<2:06:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8694/15526 [2:40:43<2:06:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8695/15526 [2:40:44<2:06:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8695/15526 [2:40:44<2:06:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8696/15526 [2:40:45<2:06:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8696/15526 [2:40:45<2:06:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8697/15526 [2:40:45<2:06:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8697/15526 [2:40:45<2:06:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8698/15526 [2:40:46<2:06:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8698/15526 [2:40:46<2:06:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8699/15526 [2:40:47<2:06:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8699/15526 [2:40:47<2:06:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8700/15526 [2:40:48<2:06:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8700/15526 [2:40:48<2:06:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8701/15526 [2:40:49<2:06:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8701/15526 [2:40:49<2:06:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8702/15526 [2:40:50<2:06:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8702/15526 [2:40:50<2:06:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8703/15526 [2:40:51<2:06:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8703/15526 [2:40:51<2:06:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8704/15526 [2:41:00<2:06:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8704/15526 [2:41:00<2:06:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8705/15526 [2:41:01<2:06:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8705/15526 [2:41:01<2:06:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8706/15526 [2:41:02<2:06:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8706/15526 [2:41:02<2:06:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8707/15526 [2:41:03<2:06:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8707/15526 [2:41:03<2:06:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8708/15526 [2:41:04<2:06:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8708/15526 [2:41:04<2:06:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8709/15526 [2:41:05<2:06:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8709/15526 [2:41:05<2:06:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8710/15526 [2:41:06<2:06:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8710/15526 [2:41:06<2:06:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8711/15526 [2:41:06<2:06:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8711/15526 [2:41:06<2:06:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8712/15526 [2:41:07<2:06:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8712/15526 [2:41:07<2:06:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8713/15526 [2:41:08<2:06:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8713/15526 [2:41:08<2:06:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8714/15526 [2:41:09<2:05:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8714/15526 [2:41:09<2:05:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8715/15526 [2:41:11<2:05:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8715/15526 [2:41:11<2:05:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8716/15526 [2:41:12<2:05:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8716/15526 [2:41:12<2:05:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8717/15526 [2:41:13<2:05:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8717/15526 [2:41:13<2:05:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8718/15526 [2:41:14<2:05:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8718/15526 [2:41:14<2:05:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8719/15526 [2:41:15<2:05:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8719/15526 [2:41:15<2:05:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8720/15526 [2:41:16<2:05:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8720/15526 [2:41:16<2:05:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8721/15526 [2:41:17<2:05:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8721/15526 [2:41:17<2:05:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8722/15526 [2:41:17<2:05:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8722/15526 [2:41:17<2:05:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8723/15526 [2:41:19<2:05:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8723/15526 [2:41:19<2:05:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8724/15526 [2:41:19<2:05:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8724/15526 [2:41:19<2:05:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8725/15526 [2:41:20<2:05:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8725/15526 [2:41:20<2:05:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8726/15526 [2:41:21<2:05:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8726/15526 [2:41:21<2:05:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8727/15526 [2:41:22<2:05:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8727/15526 [2:41:22<2:05:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8728/15526 [2:41:23<2:05:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8728/15526 [2:41:23<2:05:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8729/15526 [2:41:24<2:05:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8729/15526 [2:41:24<2:05:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8730/15526 [2:41:25<2:05:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8730/15526 [2:41:25<2:05:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8731/15526 [2:41:25<2:05:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8731/15526 [2:41:25<2:05:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8732/15526 [2:41:26<2:05:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8732/15526 [2:41:26<2:05:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8733/15526 [2:41:28<2:05:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8733/15526 [2:41:28<2:05:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8734/15526 [2:41:28<2:05:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8734/15526 [2:41:28<2:05:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8735/15526 [2:41:30<2:05:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8735/15526 [2:41:30<2:05:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8736/15526 [2:41:37<2:05:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8736/15526 [2:41:37<2:05:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8737/15526 [2:41:38<2:05:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8737/15526 [2:41:38<2:05:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8738/15526 [2:41:39<2:05:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8738/15526 [2:41:39<2:05:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8739/15526 [2:41:40<2:05:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8739/15526 [2:41:40<2:05:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8740/15526 [2:41:41<2:05:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8740/15526 [2:41:41<2:05:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8741/15526 [2:41:42<2:05:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8741/15526 [2:41:42<2:05:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8742/15526 [2:41:43<2:05:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8742/15526 [2:41:43<2:05:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8743/15526 [2:41:44<2:05:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8743/15526 [2:41:44<2:05:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8744/15526 [2:41:45<2:05:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8744/15526 [2:41:45<2:05:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8745/15526 [2:41:46<2:05:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8745/15526 [2:41:46<2:05:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8746/15526 [2:41:47<2:05:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8746/15526 [2:41:47<2:05:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8747/15526 [2:41:48<2:05:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8747/15526 [2:41:48<2:05:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8748/15526 [2:41:48<2:05:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8748/15526 [2:41:48<2:05:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8749/15526 [2:41:49<2:05:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8749/15526 [2:41:49<2:05:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8750/15526 [2:41:50<2:05:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8750/15526 [2:41:50<2:05:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8751/15526 [2:41:51<2:05:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8751/15526 [2:41:51<2:05:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8752/15526 [2:41:52<2:05:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8752/15526 [2:41:52<2:05:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8753/15526 [2:41:53<2:05:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8753/15526 [2:41:53<2:05:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8754/15526 [2:41:54<2:05:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8754/15526 [2:41:54<2:05:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8755/15526 [2:41:55<2:05:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8755/15526 [2:41:55<2:05:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8756/15526 [2:41:56<2:05:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8756/15526 [2:41:56<2:05:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8757/15526 [2:41:57<2:05:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8757/15526 [2:41:57<2:05:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8758/15526 [2:41:58<2:05:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8758/15526 [2:41:58<2:05:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8759/15526 [2:41:58<2:05:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8759/15526 [2:41:58<2:05:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8760/15526 [2:41:59<2:05:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8760/15526 [2:41:59<2:05:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8761/15526 [2:42:01<2:05:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8761/15526 [2:42:01<2:05:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8762/15526 [2:42:02<2:05:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8762/15526 [2:42:02<2:05:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8763/15526 [2:42:02<2:05:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8763/15526 [2:42:02<2:05:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8764/15526 [2:42:03<2:05:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8764/15526 [2:42:03<2:05:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8765/15526 [2:42:04<2:05:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8765/15526 [2:42:04<2:05:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8766/15526 [2:42:05<2:04:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8766/15526 [2:42:05<2:04:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8767/15526 [2:42:06<2:04:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8767/15526 [2:42:06<2:04:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8768/15526 [2:42:12<2:05:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8768/15526 [2:42:12<2:05:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8769/15526 [2:42:14<2:05:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8769/15526 [2:42:14<2:05:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8770/15526 [2:42:15<2:04:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8770/15526 [2:42:15<2:04:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8771/15526 [2:42:15<2:04:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8771/15526 [2:42:15<2:04:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 8772/15526 [2:42:17<2:04:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  56%|▌| 8772/15526 [2:42:17<2:04:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8773/15526 [2:42:18<2:04:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8773/15526 [2:42:18<2:04:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8774/15526 [2:42:19<2:04:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8774/15526 [2:42:19<2:04:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8775/15526 [2:42:20<2:04:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8775/15526 [2:42:20<2:04:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8776/15526 [2:42:21<2:04:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8776/15526 [2:42:21<2:04:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8777/15526 [2:42:22<2:04:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8777/15526 [2:42:22<2:04:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8778/15526 [2:42:23<2:04:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8778/15526 [2:42:23<2:04:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8779/15526 [2:42:24<2:04:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8779/15526 [2:42:24<2:04:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8780/15526 [2:42:25<2:04:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8780/15526 [2:42:25<2:04:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8781/15526 [2:42:26<2:04:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8781/15526 [2:42:26<2:04:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8782/15526 [2:42:27<2:04:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8782/15526 [2:42:27<2:04:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8783/15526 [2:42:27<2:04:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8783/15526 [2:42:27<2:04:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8784/15526 [2:42:29<2:04:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8784/15526 [2:42:29<2:04:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8785/15526 [2:42:30<2:04:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8785/15526 [2:42:30<2:04:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8786/15526 [2:42:30<2:04:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8786/15526 [2:42:30<2:04:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8787/15526 [2:42:31<2:04:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8787/15526 [2:42:31<2:04:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8788/15526 [2:42:32<2:04:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8788/15526 [2:42:32<2:04:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8789/15526 [2:42:32<2:04:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8789/15526 [2:42:32<2:04:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8790/15526 [2:42:34<2:04:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8790/15526 [2:42:34<2:04:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8791/15526 [2:42:35<2:04:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8791/15526 [2:42:35<2:04:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8792/15526 [2:42:36<2:04:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8792/15526 [2:42:36<2:04:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8793/15526 [2:42:37<2:04:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8793/15526 [2:42:37<2:04:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8794/15526 [2:42:37<2:04:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8794/15526 [2:42:37<2:04:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8795/15526 [2:42:38<2:04:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8795/15526 [2:42:38<2:04:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8796/15526 [2:42:39<2:04:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8796/15526 [2:42:39<2:04:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8797/15526 [2:42:39<2:04:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8797/15526 [2:42:39<2:04:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8798/15526 [2:42:40<2:04:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8798/15526 [2:42:40<2:04:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8799/15526 [2:42:41<2:04:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8799/15526 [2:42:41<2:04:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8800/15526 [2:42:48<2:04:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8800/15526 [2:42:48<2:04:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8801/15526 [2:43:14<2:04:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8801/15526 [2:43:14<2:04:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8802/15526 [2:43:15<2:04:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8802/15526 [2:43:15<2:04:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8803/15526 [2:43:15<2:04:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8803/15526 [2:43:15<2:04:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8804/15526 [2:43:16<2:04:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8804/15526 [2:43:16<2:04:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8805/15526 [2:43:17<2:04:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8805/15526 [2:43:17<2:04:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8806/15526 [2:43:18<2:04:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8806/15526 [2:43:18<2:04:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8807/15526 [2:43:18<2:04:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8807/15526 [2:43:18<2:04:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8808/15526 [2:43:19<2:04:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8808/15526 [2:43:19<2:04:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8809/15526 [2:43:20<2:04:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8809/15526 [2:43:20<2:04:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8810/15526 [2:43:20<2:04:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8810/15526 [2:43:20<2:04:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8811/15526 [2:43:21<2:04:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8811/15526 [2:43:21<2:04:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8812/15526 [2:43:22<2:04:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8812/15526 [2:43:22<2:04:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8813/15526 [2:43:23<2:04:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8813/15526 [2:43:23<2:04:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8814/15526 [2:43:24<2:04:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8814/15526 [2:43:24<2:04:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8815/15526 [2:43:24<2:04:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8815/15526 [2:43:24<2:04:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8816/15526 [2:43:25<2:04:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8816/15526 [2:43:25<2:04:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8817/15526 [2:43:26<2:04:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8817/15526 [2:43:26<2:04:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8818/15526 [2:43:26<2:04:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8818/15526 [2:43:26<2:04:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8819/15526 [2:43:27<2:04:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8819/15526 [2:43:27<2:04:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8820/15526 [2:43:29<2:04:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8820/15526 [2:43:29<2:04:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8821/15526 [2:43:30<2:04:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8821/15526 [2:43:30<2:04:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8822/15526 [2:43:30<2:04:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8822/15526 [2:43:30<2:04:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8823/15526 [2:43:31<2:04:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8823/15526 [2:43:31<2:04:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8824/15526 [2:43:32<2:04:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8824/15526 [2:43:32<2:04:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8825/15526 [2:43:32<2:04:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8825/15526 [2:43:32<2:04:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8826/15526 [2:43:33<2:04:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8826/15526 [2:43:33<2:04:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8827/15526 [2:43:34<2:04:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8827/15526 [2:43:34<2:04:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8828/15526 [2:43:34<2:04:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8828/15526 [2:43:34<2:04:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8829/15526 [2:43:35<2:04:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8829/15526 [2:43:35<2:04:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8830/15526 [2:43:36<2:04:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8830/15526 [2:43:36<2:04:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8831/15526 [2:43:38<2:04:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8831/15526 [2:43:38<2:04:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8832/15526 [2:43:48<2:04:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8832/15526 [2:43:48<2:04:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8833/15526 [2:43:48<2:04:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8833/15526 [2:43:48<2:04:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8834/15526 [2:43:49<2:04:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8834/15526 [2:43:49<2:04:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8835/15526 [2:43:50<2:04:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8835/15526 [2:43:50<2:04:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8836/15526 [2:43:50<2:04:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8836/15526 [2:43:50<2:04:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8837/15526 [2:43:51<2:04:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8837/15526 [2:43:51<2:04:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8838/15526 [2:43:52<2:04:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8838/15526 [2:43:52<2:04:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8839/15526 [2:43:53<2:03:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8839/15526 [2:43:53<2:03:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8840/15526 [2:43:54<2:03:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8840/15526 [2:43:54<2:03:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8841/15526 [2:43:55<2:03:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8841/15526 [2:43:55<2:03:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8842/15526 [2:43:56<2:03:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8842/15526 [2:43:56<2:03:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8843/15526 [2:43:57<2:03:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8843/15526 [2:43:57<2:03:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8844/15526 [2:43:58<2:03:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8844/15526 [2:43:58<2:03:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8845/15526 [2:43:58<2:03:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8845/15526 [2:43:58<2:03:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8846/15526 [2:43:59<2:03:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8846/15526 [2:43:59<2:03:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8847/15526 [2:44:00<2:03:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8847/15526 [2:44:00<2:03:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8848/15526 [2:44:00<2:03:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8848/15526 [2:44:00<2:03:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8849/15526 [2:44:01<2:03:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8849/15526 [2:44:01<2:03:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8850/15526 [2:44:02<2:03:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8850/15526 [2:44:02<2:03:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8851/15526 [2:44:03<2:03:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8851/15526 [2:44:03<2:03:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8852/15526 [2:44:04<2:03:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8852/15526 [2:44:04<2:03:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8853/15526 [2:44:04<2:03:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8853/15526 [2:44:04<2:03:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8854/15526 [2:44:05<2:03:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8854/15526 [2:44:05<2:03:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8855/15526 [2:44:06<2:03:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8855/15526 [2:44:06<2:03:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8856/15526 [2:44:06<2:03:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8856/15526 [2:44:06<2:03:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8857/15526 [2:44:07<2:03:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8857/15526 [2:44:07<2:03:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8858/15526 [2:44:08<2:03:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8858/15526 [2:44:08<2:03:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8859/15526 [2:44:09<2:03:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8859/15526 [2:44:09<2:03:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8860/15526 [2:44:10<2:03:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8860/15526 [2:44:10<2:03:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8861/15526 [2:44:11<2:03:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8861/15526 [2:44:11<2:03:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8862/15526 [2:44:12<2:03:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8862/15526 [2:44:12<2:03:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8863/15526 [2:44:13<2:03:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8863/15526 [2:44:13<2:03:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8864/15526 [2:44:23<2:03:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8864/15526 [2:44:23<2:03:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8865/15526 [2:44:23<2:03:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8865/15526 [2:44:23<2:03:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8866/15526 [2:44:25<2:03:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8866/15526 [2:44:25<2:03:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8867/15526 [2:44:25<2:03:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8867/15526 [2:44:25<2:03:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8868/15526 [2:44:26<2:03:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8868/15526 [2:44:26<2:03:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8869/15526 [2:44:27<2:03:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8869/15526 [2:44:27<2:03:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8870/15526 [2:44:28<2:03:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8870/15526 [2:44:28<2:03:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8871/15526 [2:44:29<2:03:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8871/15526 [2:44:29<2:03:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8872/15526 [2:44:30<2:03:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8872/15526 [2:44:30<2:03:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8873/15526 [2:44:31<2:03:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8873/15526 [2:44:31<2:03:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8874/15526 [2:44:32<2:03:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8874/15526 [2:44:32<2:03:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8875/15526 [2:44:33<2:03:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8875/15526 [2:44:33<2:03:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8876/15526 [2:44:34<2:03:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8876/15526 [2:44:34<2:03:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8877/15526 [2:44:35<2:03:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8877/15526 [2:44:35<2:03:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8878/15526 [2:44:35<2:03:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8878/15526 [2:44:35<2:03:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8879/15526 [2:44:36<2:03:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8879/15526 [2:44:36<2:03:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8880/15526 [2:44:38<2:03:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8880/15526 [2:44:38<2:03:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8881/15526 [2:44:39<2:03:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8881/15526 [2:44:39<2:03:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8882/15526 [2:44:39<2:03:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8882/15526 [2:44:39<2:03:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8883/15526 [2:44:41<2:03:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8883/15526 [2:44:41<2:03:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8884/15526 [2:44:42<2:03:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8884/15526 [2:44:42<2:03:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8885/15526 [2:44:42<2:03:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8885/15526 [2:44:42<2:03:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8886/15526 [2:44:43<2:03:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8886/15526 [2:44:43<2:03:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8887/15526 [2:44:44<2:03:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8887/15526 [2:44:44<2:03:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8888/15526 [2:44:45<2:03:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8888/15526 [2:44:45<2:03:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8889/15526 [2:44:46<2:03:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8889/15526 [2:44:46<2:03:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8890/15526 [2:44:47<2:03:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8890/15526 [2:44:47<2:03:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8891/15526 [2:44:47<2:02:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8891/15526 [2:44:47<2:02:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8892/15526 [2:44:48<2:02:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8892/15526 [2:44:48<2:02:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8893/15526 [2:44:49<2:02:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8893/15526 [2:44:49<2:02:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8894/15526 [2:44:50<2:02:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8894/15526 [2:44:50<2:02:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8895/15526 [2:44:51<2:02:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8895/15526 [2:44:51<2:02:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8896/15526 [2:44:57<2:02:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8896/15526 [2:44:57<2:02:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8897/15526 [2:44:58<2:02:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8897/15526 [2:44:58<2:02:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8898/15526 [2:44:59<2:02:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8898/15526 [2:44:59<2:02:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8899/15526 [2:45:00<2:02:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8899/15526 [2:45:00<2:02:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8900/15526 [2:45:00<2:02:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8900/15526 [2:45:00<2:02:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8901/15526 [2:45:01<2:02:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8901/15526 [2:45:01<2:02:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8902/15526 [2:45:02<2:02:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8902/15526 [2:45:02<2:02:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8903/15526 [2:45:03<2:02:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8903/15526 [2:45:03<2:02:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8904/15526 [2:45:04<2:02:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8904/15526 [2:45:04<2:02:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8905/15526 [2:45:05<2:02:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8905/15526 [2:45:05<2:02:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8906/15526 [2:45:06<2:02:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8906/15526 [2:45:06<2:02:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8907/15526 [2:45:07<2:02:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8907/15526 [2:45:07<2:02:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8908/15526 [2:45:08<2:02:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8908/15526 [2:45:08<2:02:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8909/15526 [2:45:09<2:02:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8909/15526 [2:45:09<2:02:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8910/15526 [2:45:10<2:02:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8910/15526 [2:45:10<2:02:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8911/15526 [2:45:10<2:02:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8911/15526 [2:45:10<2:02:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8912/15526 [2:45:11<2:02:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8912/15526 [2:45:11<2:02:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8913/15526 [2:45:13<2:02:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8913/15526 [2:45:13<2:02:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8914/15526 [2:45:13<2:02:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8914/15526 [2:45:13<2:02:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8915/15526 [2:45:14<2:02:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8915/15526 [2:45:14<2:02:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8916/15526 [2:45:15<2:02:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8916/15526 [2:45:15<2:02:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8917/15526 [2:45:15<2:02:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8917/15526 [2:45:15<2:02:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8918/15526 [2:45:16<2:02:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8918/15526 [2:45:16<2:02:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8919/15526 [2:45:17<2:02:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8919/15526 [2:45:17<2:02:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8920/15526 [2:45:18<2:02:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8920/15526 [2:45:18<2:02:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8921/15526 [2:45:18<2:02:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8921/15526 [2:45:18<2:02:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8922/15526 [2:45:20<2:02:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8922/15526 [2:45:20<2:02:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8923/15526 [2:45:20<2:02:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8923/15526 [2:45:20<2:02:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8924/15526 [2:45:21<2:02:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8924/15526 [2:45:21<2:02:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8925/15526 [2:45:22<2:02:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8925/15526 [2:45:22<2:02:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8926/15526 [2:45:23<2:02:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8926/15526 [2:45:23<2:02:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 8927/15526 [2:45:24<2:02:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  57%|▌| 8927/15526 [2:45:24<2:02:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8928/15526 [2:45:32<2:02:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8928/15526 [2:45:32<2:02:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8929/15526 [2:45:33<2:02:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8929/15526 [2:45:33<2:02:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8930/15526 [2:45:34<2:02:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8930/15526 [2:45:34<2:02:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8931/15526 [2:45:35<2:02:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8931/15526 [2:45:35<2:02:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8932/15526 [2:45:36<2:02:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8932/15526 [2:45:36<2:02:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8933/15526 [2:45:37<2:02:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8933/15526 [2:45:37<2:02:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8934/15526 [2:45:38<2:02:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8934/15526 [2:45:38<2:02:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8935/15526 [2:45:38<2:02:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8935/15526 [2:45:38<2:02:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8936/15526 [2:45:40<2:02:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8936/15526 [2:45:40<2:02:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8937/15526 [2:45:41<2:02:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8937/15526 [2:45:41<2:02:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8938/15526 [2:45:42<2:02:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8938/15526 [2:45:42<2:02:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8939/15526 [2:45:42<2:02:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8939/15526 [2:45:42<2:02:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8940/15526 [2:45:43<2:02:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8940/15526 [2:45:43<2:02:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8941/15526 [2:45:44<2:02:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8941/15526 [2:45:44<2:02:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8942/15526 [2:45:45<2:02:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8942/15526 [2:45:45<2:02:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8943/15526 [2:45:46<2:02:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8943/15526 [2:45:46<2:02:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8944/15526 [2:45:47<2:02:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8944/15526 [2:45:47<2:02:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8945/15526 [2:45:47<2:01:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8945/15526 [2:45:47<2:01:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8946/15526 [2:45:48<2:01:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8946/15526 [2:45:48<2:01:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8947/15526 [2:45:49<2:01:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8947/15526 [2:45:49<2:01:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8948/15526 [2:45:50<2:01:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8948/15526 [2:45:50<2:01:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8949/15526 [2:45:51<2:01:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8949/15526 [2:45:51<2:01:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8950/15526 [2:45:52<2:01:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8950/15526 [2:45:52<2:01:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8951/15526 [2:45:52<2:01:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8951/15526 [2:45:52<2:01:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8952/15526 [2:45:53<2:01:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8952/15526 [2:45:53<2:01:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8953/15526 [2:45:54<2:01:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8953/15526 [2:45:54<2:01:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8954/15526 [2:45:55<2:01:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8954/15526 [2:45:55<2:01:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8955/15526 [2:45:56<2:01:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8955/15526 [2:45:56<2:01:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8956/15526 [2:45:56<2:01:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8956/15526 [2:45:56<2:01:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8957/15526 [2:45:57<2:01:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8957/15526 [2:45:57<2:01:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8958/15526 [2:45:59<2:01:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8958/15526 [2:45:59<2:01:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8959/15526 [2:46:00<2:01:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8959/15526 [2:46:00<2:01:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8960/15526 [2:46:06<2:01:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8960/15526 [2:46:06<2:01:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8961/15526 [2:46:08<2:01:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8961/15526 [2:46:08<2:01:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8962/15526 [2:46:08<2:01:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8962/15526 [2:46:08<2:01:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8963/15526 [2:46:09<2:01:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8963/15526 [2:46:09<2:01:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8964/15526 [2:46:10<2:01:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8964/15526 [2:46:10<2:01:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8965/15526 [2:46:11<2:01:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8965/15526 [2:46:11<2:01:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8966/15526 [2:46:12<2:01:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8966/15526 [2:46:12<2:01:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8967/15526 [2:46:13<2:01:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8967/15526 [2:46:13<2:01:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8968/15526 [2:46:14<2:01:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8968/15526 [2:46:14<2:01:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8969/15526 [2:46:15<2:01:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8969/15526 [2:46:15<2:01:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8970/15526 [2:46:16<2:01:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8970/15526 [2:46:16<2:01:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8971/15526 [2:46:17<2:01:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8971/15526 [2:46:17<2:01:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8972/15526 [2:46:18<2:01:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8972/15526 [2:46:18<2:01:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8973/15526 [2:46:19<2:01:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8973/15526 [2:46:19<2:01:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8974/15526 [2:46:20<2:01:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8974/15526 [2:46:20<2:01:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8975/15526 [2:46:20<2:01:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8975/15526 [2:46:20<2:01:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8976/15526 [2:46:21<2:01:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8976/15526 [2:46:21<2:01:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8977/15526 [2:46:22<2:01:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8977/15526 [2:46:22<2:01:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8978/15526 [2:46:22<2:01:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8978/15526 [2:46:22<2:01:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8979/15526 [2:46:24<2:01:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8979/15526 [2:46:24<2:01:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8980/15526 [2:46:24<2:01:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8980/15526 [2:46:24<2:01:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8981/15526 [2:46:25<2:01:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8981/15526 [2:46:25<2:01:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8982/15526 [2:46:26<2:01:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8982/15526 [2:46:26<2:01:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8983/15526 [2:46:27<2:01:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8983/15526 [2:46:27<2:01:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8984/15526 [2:46:27<2:01:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8984/15526 [2:46:27<2:01:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8985/15526 [2:46:28<2:01:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8985/15526 [2:46:28<2:01:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8986/15526 [2:46:29<2:01:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8986/15526 [2:46:29<2:01:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8987/15526 [2:46:29<2:01:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8987/15526 [2:46:29<2:01:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8988/15526 [2:46:30<2:01:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8988/15526 [2:46:30<2:01:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8989/15526 [2:46:31<2:01:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8989/15526 [2:46:31<2:01:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8990/15526 [2:46:32<2:01:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8990/15526 [2:46:32<2:01:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8991/15526 [2:46:33<2:01:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8991/15526 [2:46:33<2:01:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8992/15526 [2:46:41<2:01:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8992/15526 [2:46:41<2:01:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8993/15526 [2:46:42<2:01:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8993/15526 [2:46:42<2:01:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8994/15526 [2:46:43<2:01:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8994/15526 [2:46:43<2:01:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8995/15526 [2:46:44<2:01:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8995/15526 [2:46:44<2:01:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8996/15526 [2:46:45<2:01:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8996/15526 [2:46:45<2:01:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8997/15526 [2:46:45<2:01:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8997/15526 [2:46:45<2:01:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8998/15526 [2:46:46<2:00:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|���| 8998/15526 [2:46:46<2:00:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 8999/15526 [2:46:47<2:00:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 8999/15526 [2:46:47<2:00:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9000/15526 [2:46:48<2:00:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9000/15526 [2:46:48<2:00:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9001/15526 [2:46:49<2:00:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9001/15526 [2:46:49<2:00:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9002/15526 [2:46:51<2:00:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9002/15526 [2:46:51<2:00:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9003/15526 [2:46:51<2:00:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9003/15526 [2:46:51<2:00:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9004/15526 [2:46:53<2:00:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9004/15526 [2:46:53<2:00:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9005/15526 [2:46:53<2:00:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9005/15526 [2:46:53<2:00:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9006/15526 [2:46:54<2:00:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9006/15526 [2:46:54<2:00:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9007/15526 [2:46:55<2:00:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9007/15526 [2:46:55<2:00:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9008/15526 [2:46:56<2:00:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9008/15526 [2:46:56<2:00:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9009/15526 [2:46:57<2:00:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9009/15526 [2:46:57<2:00:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9010/15526 [2:46:58<2:00:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9010/15526 [2:46:58<2:00:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9011/15526 [2:46:59<2:00:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9011/15526 [2:46:59<2:00:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9012/15526 [2:47:00<2:00:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9012/15526 [2:47:00<2:00:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9013/15526 [2:47:01<2:00:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9013/15526 [2:47:01<2:00:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9014/15526 [2:47:02<2:00:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9014/15526 [2:47:02<2:00:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9015/15526 [2:47:03<2:00:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9015/15526 [2:47:03<2:00:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9016/15526 [2:47:03<2:00:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9016/15526 [2:47:03<2:00:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9017/15526 [2:47:05<2:00:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9017/15526 [2:47:05<2:00:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9018/15526 [2:47:05<2:00:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9018/15526 [2:47:05<2:00:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9019/15526 [2:47:06<2:00:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9019/15526 [2:47:06<2:00:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9020/15526 [2:47:07<2:00:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9020/15526 [2:47:07<2:00:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9021/15526 [2:47:07<2:00:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9021/15526 [2:47:07<2:00:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9022/15526 [2:47:09<2:00:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9022/15526 [2:47:09<2:00:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9023/15526 [2:47:10<2:00:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9023/15526 [2:47:10<2:00:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9024/15526 [2:47:16<2:00:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9024/15526 [2:47:16<2:00:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9025/15526 [2:47:17<2:00:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9025/15526 [2:47:17<2:00:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9026/15526 [2:47:18<2:00:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9026/15526 [2:47:18<2:00:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9027/15526 [2:47:19<2:00:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9027/15526 [2:47:19<2:00:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9028/15526 [2:47:19<2:00:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9028/15526 [2:47:19<2:00:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9029/15526 [2:47:20<2:00:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9029/15526 [2:47:20<2:00:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9030/15526 [2:47:21<2:00:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9030/15526 [2:47:21<2:00:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9031/15526 [2:47:21<2:00:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9031/15526 [2:47:21<2:00:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9032/15526 [2:47:22<2:00:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9032/15526 [2:47:22<2:00:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9033/15526 [2:47:23<2:00:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9033/15526 [2:47:23<2:00:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9034/15526 [2:47:23<2:00:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9034/15526 [2:47:23<2:00:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9035/15526 [2:47:24<2:00:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9035/15526 [2:47:24<2:00:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9036/15526 [2:47:25<2:00:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9036/15526 [2:47:25<2:00:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9037/15526 [2:47:26<2:00:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9037/15526 [2:47:26<2:00:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9038/15526 [2:47:28<2:00:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9038/15526 [2:47:28<2:00:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9039/15526 [2:47:29<2:00:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9039/15526 [2:47:29<2:00:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9040/15526 [2:47:29<2:00:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9040/15526 [2:47:29<2:00:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9041/15526 [2:47:30<2:00:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9041/15526 [2:47:30<2:00:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9042/15526 [2:47:31<2:00:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9042/15526 [2:47:31<2:00:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9043/15526 [2:47:32<2:00:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9043/15526 [2:47:32<2:00:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9044/15526 [2:47:33<2:00:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9044/15526 [2:47:33<2:00:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9045/15526 [2:47:34<2:00:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9045/15526 [2:47:34<2:00:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9046/15526 [2:47:35<2:00:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9046/15526 [2:47:35<2:00:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9047/15526 [2:47:36<2:00:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9047/15526 [2:47:36<2:00:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9048/15526 [2:47:36<2:00:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9048/15526 [2:47:36<2:00:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9049/15526 [2:47:37<1:59:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9049/15526 [2:47:37<1:59:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9050/15526 [2:47:38<1:59:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9050/15526 [2:47:38<1:59:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9051/15526 [2:47:38<1:59:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9051/15526 [2:47:38<1:59:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9052/15526 [2:47:39<1:59:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9052/15526 [2:47:39<1:59:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9053/15526 [2:47:40<1:59:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9053/15526 [2:47:40<1:59:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9054/15526 [2:47:41<1:59:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9054/15526 [2:47:41<1:59:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9055/15526 [2:47:42<1:59:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9055/15526 [2:47:42<1:59:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9056/15526 [2:47:49<1:59:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9056/15526 [2:47:49<1:59:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9057/15526 [2:47:50<1:59:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9057/15526 [2:47:50<1:59:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9058/15526 [2:47:51<1:59:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9058/15526 [2:47:51<1:59:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9059/15526 [2:47:51<1:59:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9059/15526 [2:47:51<1:59:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9060/15526 [2:47:52<1:59:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9060/15526 [2:47:52<1:59:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9061/15526 [2:47:54<1:59:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9061/15526 [2:47:54<1:59:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9062/15526 [2:47:54<1:59:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9062/15526 [2:47:54<1:59:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9063/15526 [2:47:55<1:59:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9063/15526 [2:47:55<1:59:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9064/15526 [2:47:56<1:59:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9064/15526 [2:47:56<1:59:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9065/15526 [2:47:57<1:59:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9065/15526 [2:47:57<1:59:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9066/15526 [2:47:58<1:59:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9066/15526 [2:47:58<1:59:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9067/15526 [2:47:59<1:59:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9067/15526 [2:47:59<1:59:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9068/15526 [2:48:00<1:59:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9068/15526 [2:48:00<1:59:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9069/15526 [2:48:00<1:59:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9069/15526 [2:48:00<1:59:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9070/15526 [2:48:01<1:59:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9070/15526 [2:48:01<1:59:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9071/15526 [2:48:02<1:59:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9071/15526 [2:48:02<1:59:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9072/15526 [2:48:03<1:59:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9072/15526 [2:48:03<1:59:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9073/15526 [2:48:05<1:59:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9073/15526 [2:48:05<1:59:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9074/15526 [2:48:05<1:59:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9074/15526 [2:48:05<1:59:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9075/15526 [2:48:06<1:59:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9075/15526 [2:48:06<1:59:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9076/15526 [2:48:08<1:59:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9076/15526 [2:48:08<1:59:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9077/15526 [2:48:08<1:59:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9077/15526 [2:48:08<1:59:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9078/15526 [2:48:09<1:59:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9078/15526 [2:48:09<1:59:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9079/15526 [2:48:10<1:59:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9079/15526 [2:48:10<1:59:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9080/15526 [2:48:11<1:59:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9080/15526 [2:48:11<1:59:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9081/15526 [2:48:12<1:59:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9081/15526 [2:48:12<1:59:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 9082/15526 [2:48:13<1:59:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  58%|▌| 9082/15526 [2:48:13<1:59:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9083/15526 [2:48:14<1:59:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9083/15526 [2:48:14<1:59:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9084/15526 [2:48:15<1:59:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9084/15526 [2:48:15<1:59:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9085/15526 [2:48:16<1:59:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9085/15526 [2:48:16<1:59:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9086/15526 [2:48:17<1:59:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9086/15526 [2:48:17<1:59:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9087/15526 [2:48:18<1:59:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9087/15526 [2:48:18<1:59:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9088/15526 [2:48:24<1:59:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9088/15526 [2:48:24<1:59:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9089/15526 [2:48:25<1:59:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9089/15526 [2:48:25<1:59:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9090/15526 [2:48:25<1:59:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9090/15526 [2:48:25<1:59:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9091/15526 [2:48:26<1:59:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9091/15526 [2:48:26<1:59:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9092/15526 [2:48:27<1:59:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9092/15526 [2:48:27<1:59:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9093/15526 [2:48:28<1:59:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9093/15526 [2:48:28<1:59:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9094/15526 [2:48:29<1:59:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9094/15526 [2:48:29<1:59:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9095/15526 [2:48:30<1:59:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9095/15526 [2:48:30<1:59:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9096/15526 [2:48:31<1:59:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9096/15526 [2:48:31<1:59:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9097/15526 [2:48:31<1:59:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9097/15526 [2:48:31<1:59:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9098/15526 [2:48:33<1:59:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9098/15526 [2:48:33<1:59:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9099/15526 [2:48:34<1:59:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9099/15526 [2:48:34<1:59:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9100/15526 [2:48:35<1:59:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9100/15526 [2:48:35<1:59:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9101/15526 [2:48:36<1:59:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9101/15526 [2:48:36<1:59:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9102/15526 [2:48:37<1:59:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9102/15526 [2:48:37<1:59:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9103/15526 [2:48:38<1:58:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9103/15526 [2:48:38<1:58:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9104/15526 [2:48:39<1:58:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9104/15526 [2:48:39<1:58:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9105/15526 [2:48:39<1:58:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9105/15526 [2:48:39<1:58:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9106/15526 [2:48:41<1:58:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9106/15526 [2:48:41<1:58:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9107/15526 [2:48:41<1:58:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9107/15526 [2:48:41<1:58:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9108/15526 [2:48:42<1:58:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9108/15526 [2:48:42<1:58:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9109/15526 [2:48:43<1:58:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9109/15526 [2:48:43<1:58:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9110/15526 [2:48:44<1:58:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9110/15526 [2:48:44<1:58:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9111/15526 [2:48:44<1:58:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9111/15526 [2:48:44<1:58:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9112/15526 [2:48:46<1:58:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9112/15526 [2:48:46<1:58:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9113/15526 [2:48:47<1:58:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9113/15526 [2:48:47<1:58:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9114/15526 [2:48:47<1:58:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9114/15526 [2:48:47<1:58:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9115/15526 [2:48:48<1:58:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9115/15526 [2:48:48<1:58:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9116/15526 [2:48:49<1:58:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9116/15526 [2:48:49<1:58:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9117/15526 [2:48:49<1:58:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9117/15526 [2:48:49<1:58:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9118/15526 [2:48:50<1:58:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9118/15526 [2:48:50<1:58:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9119/15526 [2:48:51<1:58:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9119/15526 [2:48:51<1:58:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9120/15526 [2:49:00<1:58:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9120/15526 [2:49:00<1:58:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9121/15526 [2:49:01<1:58:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9121/15526 [2:49:01<1:58:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9122/15526 [2:49:03<1:58:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9122/15526 [2:49:03<1:58:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9123/15526 [2:49:04<1:58:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9123/15526 [2:49:04<1:58:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9124/15526 [2:49:05<1:58:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9124/15526 [2:49:05<1:58:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9125/15526 [2:49:06<1:58:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9125/15526 [2:49:06<1:58:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9126/15526 [2:49:07<1:58:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9126/15526 [2:49:07<1:58:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9127/15526 [2:49:07<1:58:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9127/15526 [2:49:07<1:58:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9128/15526 [2:49:09<1:58:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9128/15526 [2:49:09<1:58:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9129/15526 [2:49:09<1:58:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9129/15526 [2:49:09<1:58:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9130/15526 [2:49:10<1:58:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9130/15526 [2:49:10<1:58:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9131/15526 [2:49:11<1:58:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9131/15526 [2:49:11<1:58:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9132/15526 [2:49:11<1:58:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9132/15526 [2:49:11<1:58:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9133/15526 [2:49:12<1:58:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9133/15526 [2:49:12<1:58:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9134/15526 [2:49:13<1:58:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9134/15526 [2:49:13<1:58:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9135/15526 [2:49:13<1:58:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9135/15526 [2:49:13<1:58:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9136/15526 [2:49:14<1:58:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9136/15526 [2:49:14<1:58:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9137/15526 [2:49:15<1:58:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9137/15526 [2:49:15<1:58:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9138/15526 [2:49:15<1:58:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9138/15526 [2:49:15<1:58:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9139/15526 [2:49:16<1:58:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9139/15526 [2:49:16<1:58:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9140/15526 [2:49:17<1:58:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9140/15526 [2:49:17<1:58:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9141/15526 [2:49:18<1:58:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9141/15526 [2:49:18<1:58:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9142/15526 [2:49:19<1:58:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9142/15526 [2:49:19<1:58:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9143/15526 [2:49:19<1:58:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9143/15526 [2:49:19<1:58:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9144/15526 [2:49:21<1:58:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9144/15526 [2:49:21<1:58:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9145/15526 [2:49:21<1:58:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9145/15526 [2:49:21<1:58:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9146/15526 [2:49:22<1:58:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9146/15526 [2:49:22<1:58:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9147/15526 [2:49:23<1:58:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9147/15526 [2:49:23<1:58:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9148/15526 [2:49:24<1:58:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9148/15526 [2:49:24<1:58:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9149/15526 [2:49:25<1:58:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9149/15526 [2:49:25<1:58:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9150/15526 [2:49:26<1:58:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9150/15526 [2:49:26<1:58:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9151/15526 [2:49:26<1:58:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9151/15526 [2:49:26<1:58:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9152/15526 [2:49:34<1:58:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9152/15526 [2:49:34<1:58:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9153/15526 [2:49:35<1:58:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9153/15526 [2:49:35<1:58:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9154/15526 [2:49:36<1:58:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9154/15526 [2:49:36<1:58:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9155/15526 [2:49:37<1:58:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9155/15526 [2:49:37<1:58:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9156/15526 [2:49:38<1:58:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9156/15526 [2:49:38<1:58:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9157/15526 [2:49:39<1:57:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9157/15526 [2:49:39<1:57:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9158/15526 [2:49:40<1:57:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9158/15526 [2:49:40<1:57:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9159/15526 [2:49:41<1:57:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9159/15526 [2:49:41<1:57:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9160/15526 [2:49:42<1:57:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9160/15526 [2:49:42<1:57:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9161/15526 [2:49:42<1:57:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9161/15526 [2:49:42<1:57:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9162/15526 [2:49:43<1:57:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9162/15526 [2:49:43<1:57:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9163/15526 [2:49:44<1:57:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9163/15526 [2:49:44<1:57:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9164/15526 [2:49:45<1:57:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9164/15526 [2:49:45<1:57:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9165/15526 [2:49:46<1:57:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9165/15526 [2:49:46<1:57:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9166/15526 [2:49:47<1:57:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9166/15526 [2:49:47<1:57:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9167/15526 [2:49:48<1:57:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9167/15526 [2:49:48<1:57:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9168/15526 [2:49:49<1:57:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9168/15526 [2:49:49<1:57:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9169/15526 [2:49:49<1:57:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9169/15526 [2:49:49<1:57:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9170/15526 [2:49:50<1:57:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9170/15526 [2:49:50<1:57:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9171/15526 [2:49:51<1:57:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9171/15526 [2:49:51<1:57:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9172/15526 [2:49:51<1:57:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9172/15526 [2:49:51<1:57:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9173/15526 [2:49:53<1:57:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9173/15526 [2:49:53<1:57:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9174/15526 [2:49:53<1:57:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9174/15526 [2:49:53<1:57:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9175/15526 [2:49:54<1:57:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9175/15526 [2:49:54<1:57:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9176/15526 [2:49:55<1:57:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9176/15526 [2:49:55<1:57:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9177/15526 [2:49:56<1:57:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9177/15526 [2:49:56<1:57:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9178/15526 [2:49:57<1:57:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9178/15526 [2:49:57<1:57:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9179/15526 [2:49:58<1:57:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9179/15526 [2:49:58<1:57:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9180/15526 [2:49:59<1:57:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9180/15526 [2:49:59<1:57:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9181/15526 [2:49:59<1:57:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9181/15526 [2:49:59<1:57:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9182/15526 [2:50:00<1:57:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9182/15526 [2:50:00<1:57:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9183/15526 [2:50:01<1:57:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9183/15526 [2:50:01<1:57:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9184/15526 [2:50:10<1:57:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9184/15526 [2:50:10<1:57:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9185/15526 [2:50:11<1:57:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9185/15526 [2:50:11<1:57:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9186/15526 [2:50:11<1:57:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9186/15526 [2:50:11<1:57:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9187/15526 [2:50:13<1:57:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9187/15526 [2:50:13<1:57:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9188/15526 [2:50:13<1:57:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9188/15526 [2:50:13<1:57:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9189/15526 [2:50:14<1:57:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9189/15526 [2:50:14<1:57:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9190/15526 [2:50:15<1:57:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9190/15526 [2:50:15<1:57:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9191/15526 [2:50:16<1:57:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9191/15526 [2:50:16<1:57:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9192/15526 [2:50:17<1:57:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9192/15526 [2:50:17<1:57:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9193/15526 [2:50:18<1:57:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9193/15526 [2:50:18<1:57:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9194/15526 [2:50:18<1:57:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9194/15526 [2:50:18<1:57:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9195/15526 [2:50:19<1:57:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9195/15526 [2:50:19<1:57:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9196/15526 [2:50:20<1:57:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9196/15526 [2:50:20<1:57:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9197/15526 [2:50:20<1:57:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9197/15526 [2:50:20<1:57:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9198/15526 [2:50:22<1:57:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9198/15526 [2:50:22<1:57:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9199/15526 [2:50:23<1:57:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9199/15526 [2:50:23<1:57:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9200/15526 [2:50:24<1:57:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9200/15526 [2:50:24<1:57:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9201/15526 [2:50:25<1:57:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9201/15526 [2:50:25<1:57:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9202/15526 [2:50:26<1:57:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9202/15526 [2:50:26<1:57:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9203/15526 [2:50:27<1:57:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9203/15526 [2:50:27<1:57:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9204/15526 [2:50:28<1:57:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9204/15526 [2:50:28<1:57:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9205/15526 [2:50:29<1:57:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9205/15526 [2:50:29<1:57:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9206/15526 [2:50:29<1:57:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9206/15526 [2:50:29<1:57:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9207/15526 [2:50:31<1:57:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9207/15526 [2:50:31<1:57:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9208/15526 [2:50:32<1:57:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9208/15526 [2:50:32<1:57:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9209/15526 [2:50:33<1:56:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9209/15526 [2:50:33<1:56:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9210/15526 [2:50:34<1:56:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9210/15526 [2:50:34<1:56:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9211/15526 [2:50:34<1:56:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9211/15526 [2:50:34<1:56:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9212/15526 [2:50:35<1:56:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9212/15526 [2:50:35<1:56:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9213/15526 [2:50:36<1:56:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9213/15526 [2:50:36<1:56:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9214/15526 [2:50:37<1:56:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9214/15526 [2:50:37<1:56:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9215/15526 [2:50:38<1:56:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9215/15526 [2:50:38<1:56:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9216/15526 [2:50:45<1:56:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9216/15526 [2:50:45<1:56:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9217/15526 [2:50:46<1:56:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9217/15526 [2:50:46<1:56:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9218/15526 [2:50:47<1:56:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9218/15526 [2:50:47<1:56:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9219/15526 [2:50:48<1:56:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9219/15526 [2:50:48<1:56:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9220/15526 [2:50:48<1:56:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9220/15526 [2:50:48<1:56:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9221/15526 [2:50:49<1:56:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9221/15526 [2:50:49<1:56:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9222/15526 [2:50:51<1:56:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9222/15526 [2:50:51<1:56:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9223/15526 [2:50:52<1:56:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9223/15526 [2:50:52<1:56:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9224/15526 [2:50:53<1:56:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9224/15526 [2:50:53<1:56:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9225/15526 [2:50:53<1:56:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9225/15526 [2:50:53<1:56:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9226/15526 [2:50:54<1:56:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9226/15526 [2:50:54<1:56:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9227/15526 [2:50:55<1:56:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9227/15526 [2:50:55<1:56:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9228/15526 [2:50:55<1:56:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9228/15526 [2:50:55<1:56:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9229/15526 [2:50:56<1:56:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9229/15526 [2:50:56<1:56:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9230/15526 [2:50:57<1:56:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9230/15526 [2:50:57<1:56:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9231/15526 [2:50:58<1:56:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9231/15526 [2:50:58<1:56:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9232/15526 [2:51:00<1:56:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9232/15526 [2:51:00<1:56:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9233/15526 [2:51:00<1:56:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9233/15526 [2:51:00<1:56:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9234/15526 [2:51:01<1:56:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9234/15526 [2:51:01<1:56:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9235/15526 [2:51:02<1:56:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9235/15526 [2:51:02<1:56:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9236/15526 [2:51:02<1:56:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9236/15526 [2:51:02<1:56:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 9237/15526 [2:51:03<1:56:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  59%|▌| 9237/15526 [2:51:03<1:56:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9238/15526 [2:51:04<1:56:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9238/15526 [2:51:04<1:56:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9239/15526 [2:51:04<1:56:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9239/15526 [2:51:04<1:56:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9240/15526 [2:51:05<1:56:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9240/15526 [2:51:05<1:56:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9241/15526 [2:51:06<1:56:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9241/15526 [2:51:06<1:56:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9242/15526 [2:51:06<1:56:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9242/15526 [2:51:06<1:56:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9243/15526 [2:51:08<1:56:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9243/15526 [2:51:08<1:56:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9244/15526 [2:51:09<1:56:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9244/15526 [2:51:09<1:56:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9245/15526 [2:51:10<1:56:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9245/15526 [2:51:10<1:56:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9246/15526 [2:51:10<1:56:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9246/15526 [2:51:10<1:56:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9247/15526 [2:51:11<1:56:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9247/15526 [2:51:11<1:56:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9248/15526 [2:51:18<1:56:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9248/15526 [2:51:18<1:56:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9249/15526 [2:51:19<1:56:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9249/15526 [2:51:19<1:56:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9250/15526 [2:51:20<1:56:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9250/15526 [2:51:20<1:56:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9251/15526 [2:51:21<1:56:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9251/15526 [2:51:21<1:56:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9252/15526 [2:51:21<1:56:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9252/15526 [2:51:21<1:56:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9253/15526 [2:51:22<1:56:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9253/15526 [2:51:22<1:56:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9254/15526 [2:51:23<1:56:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9254/15526 [2:51:23<1:56:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9255/15526 [2:51:24<1:56:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9255/15526 [2:51:24<1:56:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9256/15526 [2:51:25<1:56:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9256/15526 [2:51:25<1:56:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9257/15526 [2:51:25<1:56:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9257/15526 [2:51:25<1:56:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9258/15526 [2:51:26<1:56:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9258/15526 [2:51:26<1:56:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9259/15526 [2:51:27<1:56:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9259/15526 [2:51:27<1:56:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9260/15526 [2:51:27<1:56:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9260/15526 [2:51:27<1:56:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9261/15526 [2:51:29<1:56:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9261/15526 [2:51:29<1:56:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9262/15526 [2:51:29<1:55:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9262/15526 [2:51:29<1:55:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9263/15526 [2:51:31<1:55:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9263/15526 [2:51:31<1:55:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9264/15526 [2:51:32<1:55:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9264/15526 [2:51:32<1:55:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9265/15526 [2:51:32<1:55:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9265/15526 [2:51:32<1:55:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9266/15526 [2:51:33<1:55:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9266/15526 [2:51:33<1:55:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9267/15526 [2:51:34<1:55:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9267/15526 [2:51:34<1:55:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9268/15526 [2:51:35<1:55:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9268/15526 [2:51:35<1:55:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9269/15526 [2:51:36<1:55:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9269/15526 [2:51:36<1:55:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9270/15526 [2:51:37<1:55:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9270/15526 [2:51:37<1:55:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9271/15526 [2:51:38<1:55:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9271/15526 [2:51:38<1:55:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9272/15526 [2:51:39<1:55:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9272/15526 [2:51:39<1:55:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9273/15526 [2:51:39<1:55:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9273/15526 [2:51:39<1:55:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9274/15526 [2:51:41<1:55:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9274/15526 [2:51:41<1:55:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9275/15526 [2:51:41<1:55:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9275/15526 [2:51:41<1:55:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9276/15526 [2:51:42<1:55:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9276/15526 [2:51:42<1:55:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9277/15526 [2:51:43<1:55:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9277/15526 [2:51:43<1:55:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9278/15526 [2:51:44<1:55:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9278/15526 [2:51:44<1:55:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9279/15526 [2:51:45<1:55:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9279/15526 [2:51:45<1:55:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9280/15526 [2:51:51<1:55:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9280/15526 [2:51:51<1:55:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9281/15526 [2:51:52<1:55:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9281/15526 [2:51:52<1:55:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9282/15526 [2:51:53<1:55:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9282/15526 [2:51:53<1:55:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9283/15526 [2:51:54<1:55:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9283/15526 [2:51:54<1:55:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9284/15526 [2:51:55<1:55:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9284/15526 [2:51:55<1:55:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9285/15526 [2:51:57<1:55:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9285/15526 [2:51:57<1:55:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9286/15526 [2:51:58<1:55:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9286/15526 [2:51:58<1:55:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9287/15526 [2:51:59<1:55:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9287/15526 [2:51:59<1:55:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9288/15526 [2:52:00<1:55:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9288/15526 [2:52:00<1:55:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9289/15526 [2:52:01<1:55:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9289/15526 [2:52:01<1:55:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9290/15526 [2:52:02<1:55:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9290/15526 [2:52:02<1:55:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9291/15526 [2:52:03<1:55:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9291/15526 [2:52:03<1:55:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9292/15526 [2:52:03<1:55:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9292/15526 [2:52:03<1:55:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9293/15526 [2:52:05<1:55:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9293/15526 [2:52:05<1:55:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9294/15526 [2:52:05<1:55:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9294/15526 [2:52:05<1:55:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9295/15526 [2:52:06<1:55:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9295/15526 [2:52:06<1:55:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9296/15526 [2:52:07<1:55:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9296/15526 [2:52:07<1:55:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9297/15526 [2:52:07<1:55:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9297/15526 [2:52:07<1:55:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9298/15526 [2:52:08<1:55:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9298/15526 [2:52:08<1:55:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9299/15526 [2:52:09<1:55:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9299/15526 [2:52:09<1:55:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9300/15526 [2:52:10<1:55:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9300/15526 [2:52:10<1:55:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9301/15526 [2:52:11<1:55:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9301/15526 [2:52:11<1:55:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9302/15526 [2:52:11<1:55:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9302/15526 [2:52:11<1:55:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9303/15526 [2:52:13<1:55:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9303/15526 [2:52:13<1:55:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9304/15526 [2:52:13<1:55:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9304/15526 [2:52:13<1:55:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9305/15526 [2:52:14<1:55:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9305/15526 [2:52:14<1:55:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9306/15526 [2:52:15<1:55:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9306/15526 [2:52:15<1:55:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9307/15526 [2:52:15<1:55:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9307/15526 [2:52:15<1:55:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9308/15526 [2:52:16<1:55:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9308/15526 [2:52:16<1:55:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9309/15526 [2:52:17<1:55:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9309/15526 [2:52:17<1:55:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9310/15526 [2:52:18<1:55:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9310/15526 [2:52:18<1:55:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9311/15526 [2:52:19<1:55:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9311/15526 [2:52:19<1:55:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9312/15526 [2:52:25<1:55:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9312/15526 [2:52:25<1:55:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9313/15526 [2:52:26<1:55:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9313/15526 [2:52:26<1:55:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9314/15526 [2:52:26<1:55:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9314/15526 [2:52:26<1:55:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9315/15526 [2:52:27<1:54:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9315/15526 [2:52:27<1:54:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9316/15526 [2:52:28<1:54:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9316/15526 [2:52:28<1:54:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9317/15526 [2:52:29<1:54:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9317/15526 [2:52:29<1:54:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9318/15526 [2:52:29<1:54:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9318/15526 [2:52:29<1:54:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9319/15526 [2:52:30<1:54:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9319/15526 [2:52:30<1:54:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9320/15526 [2:52:31<1:54:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9320/15526 [2:52:31<1:54:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9321/15526 [2:52:31<1:54:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9321/15526 [2:52:31<1:54:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9322/15526 [2:52:32<1:54:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9322/15526 [2:52:32<1:54:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9323/15526 [2:52:33<1:54:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9323/15526 [2:52:33<1:54:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9324/15526 [2:52:34<1:54:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9324/15526 [2:52:34<1:54:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9325/15526 [2:52:35<1:54:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9325/15526 [2:52:35<1:54:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9326/15526 [2:52:36<1:54:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9326/15526 [2:52:36<1:54:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9327/15526 [2:52:37<1:54:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9327/15526 [2:52:37<1:54:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9328/15526 [2:52:38<1:54:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9328/15526 [2:52:38<1:54:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9329/15526 [2:52:39<1:54:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9329/15526 [2:52:39<1:54:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9330/15526 [2:52:40<1:54:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9330/15526 [2:52:40<1:54:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9331/15526 [2:52:41<1:54:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9331/15526 [2:52:41<1:54:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9332/15526 [2:52:42<1:54:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9332/15526 [2:52:42<1:54:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9333/15526 [2:52:42<1:54:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9333/15526 [2:52:42<1:54:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9334/15526 [2:52:43<1:54:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9334/15526 [2:52:43<1:54:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9335/15526 [2:52:44<1:54:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9335/15526 [2:52:44<1:54:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9336/15526 [2:52:45<1:54:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9336/15526 [2:52:45<1:54:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9337/15526 [2:52:46<1:54:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9337/15526 [2:52:46<1:54:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9338/15526 [2:52:46<1:54:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9338/15526 [2:52:46<1:54:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9339/15526 [2:52:47<1:54:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9339/15526 [2:52:47<1:54:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9340/15526 [2:52:49<1:54:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9340/15526 [2:52:49<1:54:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9341/15526 [2:52:50<1:54:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9341/15526 [2:52:50<1:54:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9342/15526 [2:52:51<1:54:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9342/15526 [2:52:51<1:54:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9343/15526 [2:52:52<1:54:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9343/15526 [2:52:52<1:54:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9344/15526 [2:53:00<1:54:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9344/15526 [2:53:00<1:54:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9345/15526 [2:53:01<1:54:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9345/15526 [2:53:01<1:54:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9346/15526 [2:53:02<1:54:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9346/15526 [2:53:02<1:54:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9347/15526 [2:53:02<1:54:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9347/15526 [2:53:02<1:54:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9348/15526 [2:53:04<1:54:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9348/15526 [2:53:04<1:54:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9349/15526 [2:53:04<1:54:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9349/15526 [2:53:04<1:54:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9350/15526 [2:53:05<1:54:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9350/15526 [2:53:05<1:54:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9351/15526 [2:53:06<1:54:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9351/15526 [2:53:06<1:54:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9352/15526 [2:53:06<1:54:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9352/15526 [2:53:06<1:54:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9353/15526 [2:53:07<1:54:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9353/15526 [2:53:07<1:54:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9354/15526 [2:53:08<1:54:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9354/15526 [2:53:08<1:54:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9355/15526 [2:53:08<1:54:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9355/15526 [2:53:08<1:54:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9356/15526 [2:53:09<1:54:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9356/15526 [2:53:09<1:54:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9357/15526 [2:53:10<1:54:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9357/15526 [2:53:10<1:54:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9358/15526 [2:53:10<1:54:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9358/15526 [2:53:10<1:54:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9359/15526 [2:53:11<1:54:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9359/15526 [2:53:11<1:54:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9360/15526 [2:53:12<1:54:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9360/15526 [2:53:12<1:54:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9361/15526 [2:53:12<1:54:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9361/15526 [2:53:12<1:54:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9362/15526 [2:53:13<1:54:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9362/15526 [2:53:13<1:54:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9363/15526 [2:53:14<1:54:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9363/15526 [2:53:14<1:54:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9364/15526 [2:53:15<1:54:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9364/15526 [2:53:15<1:54:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9365/15526 [2:53:16<1:53:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9365/15526 [2:53:16<1:53:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9366/15526 [2:53:16<1:53:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9366/15526 [2:53:16<1:53:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9367/15526 [2:53:17<1:53:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9367/15526 [2:53:17<1:53:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9368/15526 [2:53:18<1:53:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9368/15526 [2:53:18<1:53:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9369/15526 [2:53:18<1:53:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9369/15526 [2:53:18<1:53:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9370/15526 [2:53:20<1:53:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9370/15526 [2:53:20<1:53:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9371/15526 [2:53:20<1:53:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9371/15526 [2:53:20<1:53:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9372/15526 [2:53:21<1:53:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9372/15526 [2:53:21<1:53:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9373/15526 [2:53:22<1:53:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9373/15526 [2:53:22<1:53:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9374/15526 [2:53:23<1:53:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9374/15526 [2:53:23<1:53:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9375/15526 [2:53:24<1:53:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9375/15526 [2:53:24<1:53:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9376/15526 [2:53:33<1:53:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9376/15526 [2:53:33<1:53:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9377/15526 [2:53:34<1:53:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9377/15526 [2:53:34<1:53:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9378/15526 [2:53:35<1:53:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9378/15526 [2:53:35<1:53:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9379/15526 [2:53:36<1:53:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9379/15526 [2:53:36<1:53:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9380/15526 [2:53:37<1:53:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9380/15526 [2:53:37<1:53:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9381/15526 [2:53:38<1:53:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9381/15526 [2:53:38<1:53:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9382/15526 [2:53:39<1:53:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9382/15526 [2:53:39<1:53:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9383/15526 [2:53:40<1:53:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9383/15526 [2:53:40<1:53:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9384/15526 [2:53:40<1:53:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9384/15526 [2:53:40<1:53:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9385/15526 [2:53:41<1:53:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9385/15526 [2:53:41<1:53:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9386/15526 [2:53:42<1:53:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9386/15526 [2:53:42<1:53:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9387/15526 [2:53:42<1:53:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9387/15526 [2:53:42<1:53:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9388/15526 [2:53:43<1:53:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9388/15526 [2:53:43<1:53:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9389/15526 [2:53:44<1:53:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9389/15526 [2:53:44<1:53:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9390/15526 [2:53:44<1:53:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9390/15526 [2:53:44<1:53:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9391/15526 [2:53:45<1:53:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9391/15526 [2:53:45<1:53:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9392/15526 [2:53:46<1:53:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9392/15526 [2:53:46<1:53:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 9393/15526 [2:53:47<1:53:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  60%|▌| 9393/15526 [2:53:47<1:53:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9394/15526 [2:53:48<1:53:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9394/15526 [2:53:48<1:53:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9395/15526 [2:53:49<1:53:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9395/15526 [2:53:49<1:53:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9396/15526 [2:53:50<1:53:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9396/15526 [2:53:50<1:53:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9397/15526 [2:53:51<1:53:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9397/15526 [2:53:51<1:53:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9398/15526 [2:53:52<1:53:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9398/15526 [2:53:52<1:53:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9399/15526 [2:53:53<1:53:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9399/15526 [2:53:53<1:53:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9400/15526 [2:53:54<1:53:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9400/15526 [2:53:54<1:53:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9401/15526 [2:53:55<1:53:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9401/15526 [2:53:55<1:53:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9402/15526 [2:53:56<1:53:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9402/15526 [2:53:56<1:53:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9403/15526 [2:53:57<1:53:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9403/15526 [2:53:57<1:53:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9404/15526 [2:53:58<1:53:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9404/15526 [2:53:58<1:53:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9405/15526 [2:53:59<1:53:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9405/15526 [2:53:59<1:53:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9406/15526 [2:54:00<1:53:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9406/15526 [2:54:00<1:53:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9407/15526 [2:54:00<1:53:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9407/15526 [2:54:00<1:53:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9408/15526 [2:54:07<1:53:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9408/15526 [2:54:07<1:53:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9409/15526 [2:54:08<1:53:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9409/15526 [2:54:08<1:53:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9410/15526 [2:54:09<1:53:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9410/15526 [2:54:09<1:53:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9411/15526 [2:54:10<1:53:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9411/15526 [2:54:10<1:53:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9412/15526 [2:54:11<1:53:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9412/15526 [2:54:11<1:53:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9413/15526 [2:54:12<1:53:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9413/15526 [2:54:12<1:53:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9414/15526 [2:54:12<1:53:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9414/15526 [2:54:12<1:53:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9415/15526 [2:54:13<1:53:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9415/15526 [2:54:13<1:53:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9416/15526 [2:54:14<1:53:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9416/15526 [2:54:14<1:53:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9417/15526 [2:54:14<1:53:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9417/15526 [2:54:14<1:53:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9418/15526 [2:54:15<1:53:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9418/15526 [2:54:15<1:53:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9419/15526 [2:54:16<1:52:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9419/15526 [2:54:16<1:52:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9420/15526 [2:54:17<1:52:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9420/15526 [2:54:17<1:52:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9421/15526 [2:54:18<1:52:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9421/15526 [2:54:18<1:52:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9422/15526 [2:54:19<1:52:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9422/15526 [2:54:19<1:52:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9423/15526 [2:54:20<1:52:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9423/15526 [2:54:20<1:52:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9424/15526 [2:54:21<1:52:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9424/15526 [2:54:21<1:52:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9425/15526 [2:54:22<1:52:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9425/15526 [2:54:22<1:52:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9426/15526 [2:54:23<1:52:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9426/15526 [2:54:23<1:52:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9427/15526 [2:54:24<1:52:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9427/15526 [2:54:24<1:52:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9428/15526 [2:54:24<1:52:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9428/15526 [2:54:24<1:52:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9429/15526 [2:54:25<1:52:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9429/15526 [2:54:25<1:52:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9430/15526 [2:54:26<1:52:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9430/15526 [2:54:26<1:52:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9431/15526 [2:54:27<1:52:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9431/15526 [2:54:27<1:52:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9432/15526 [2:54:28<1:52:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9432/15526 [2:54:28<1:52:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9433/15526 [2:54:29<1:52:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9433/15526 [2:54:29<1:52:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9434/15526 [2:54:30<1:52:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9434/15526 [2:54:30<1:52:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9435/15526 [2:54:31<1:52:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9435/15526 [2:54:31<1:52:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9436/15526 [2:54:32<1:52:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9436/15526 [2:54:32<1:52:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9437/15526 [2:54:33<1:52:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9437/15526 [2:54:33<1:52:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9438/15526 [2:54:34<1:52:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9438/15526 [2:54:34<1:52:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9439/15526 [2:54:35<1:52:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9439/15526 [2:54:35<1:52:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9440/15526 [2:54:41<1:52:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9440/15526 [2:54:41<1:52:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9441/15526 [2:54:42<1:52:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9441/15526 [2:54:42<1:52:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9442/15526 [2:54:43<1:52:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9442/15526 [2:54:43<1:52:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9443/15526 [2:54:44<1:52:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9443/15526 [2:54:44<1:52:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9444/15526 [2:54:45<1:52:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9444/15526 [2:54:45<1:52:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9445/15526 [2:54:46<1:52:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9445/15526 [2:54:46<1:52:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9446/15526 [2:54:47<1:52:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9446/15526 [2:54:47<1:52:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9447/15526 [2:54:47<1:52:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9447/15526 [2:54:47<1:52:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9448/15526 [2:54:48<1:52:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9448/15526 [2:54:48<1:52:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9449/15526 [2:54:49<1:52:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9449/15526 [2:54:49<1:52:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9450/15526 [2:54:50<1:52:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9450/15526 [2:54:50<1:52:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9451/15526 [2:54:51<1:52:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9451/15526 [2:54:51<1:52:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9452/15526 [2:54:52<1:52:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9452/15526 [2:54:52<1:52:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9453/15526 [2:54:53<1:52:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9453/15526 [2:54:53<1:52:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9454/15526 [2:54:53<1:52:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9454/15526 [2:54:53<1:52:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9455/15526 [2:54:54<1:52:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9455/15526 [2:54:54<1:52:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9456/15526 [2:54:55<1:52:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9456/15526 [2:54:55<1:52:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9457/15526 [2:54:56<1:52:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9457/15526 [2:54:56<1:52:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9458/15526 [2:54:58<1:52:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9458/15526 [2:54:58<1:52:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9459/15526 [2:54:58<1:52:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9459/15526 [2:54:58<1:52:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9460/15526 [2:54:59<1:52:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9460/15526 [2:54:59<1:52:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9461/15526 [2:55:00<1:52:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9461/15526 [2:55:00<1:52:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9462/15526 [2:55:01<1:52:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9462/15526 [2:55:01<1:52:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9463/15526 [2:55:02<1:52:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9463/15526 [2:55:02<1:52:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9464/15526 [2:55:02<1:52:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9464/15526 [2:55:02<1:52:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9465/15526 [2:55:03<1:52:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9465/15526 [2:55:03<1:52:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9466/15526 [2:55:04<1:52:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9466/15526 [2:55:04<1:52:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9467/15526 [2:55:04<1:52:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9467/15526 [2:55:04<1:52:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9468/15526 [2:55:05<1:52:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9468/15526 [2:55:05<1:52:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9469/15526 [2:55:06<1:52:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9469/15526 [2:55:06<1:52:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9470/15526 [2:55:07<1:51:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9470/15526 [2:55:07<1:51:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9471/15526 [2:55:08<1:51:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9471/15526 [2:55:08<1:51:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9472/15526 [2:55:16<1:52:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9472/15526 [2:55:16<1:52:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9473/15526 [2:55:17<1:52:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9473/15526 [2:55:17<1:52:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9474/15526 [2:55:18<1:51:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9474/15526 [2:55:18<1:51:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9475/15526 [2:55:18<1:51:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9475/15526 [2:55:18<1:51:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9476/15526 [2:55:19<1:51:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9476/15526 [2:55:19<1:51:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9477/15526 [2:55:20<1:51:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9477/15526 [2:55:20<1:51:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9478/15526 [2:55:21<1:51:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9478/15526 [2:55:21<1:51:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9479/15526 [2:55:22<1:51:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9479/15526 [2:55:22<1:51:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9480/15526 [2:55:23<1:51:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9480/15526 [2:55:23<1:51:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9481/15526 [2:55:24<1:51:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9481/15526 [2:55:24<1:51:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9482/15526 [2:55:24<1:51:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9482/15526 [2:55:24<1:51:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9483/15526 [2:55:25<1:51:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9483/15526 [2:55:25<1:51:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9484/15526 [2:55:26<1:51:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9484/15526 [2:55:26<1:51:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9485/15526 [2:55:27<1:51:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9485/15526 [2:55:27<1:51:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9486/15526 [2:55:28<1:51:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9486/15526 [2:55:28<1:51:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9487/15526 [2:55:28<1:51:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9487/15526 [2:55:28<1:51:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9488/15526 [2:55:29<1:51:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9488/15526 [2:55:29<1:51:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9489/15526 [2:55:30<1:51:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9489/15526 [2:55:30<1:51:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9490/15526 [2:55:30<1:51:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9490/15526 [2:55:30<1:51:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9491/15526 [2:55:31<1:51:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9491/15526 [2:55:31<1:51:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9492/15526 [2:55:32<1:51:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9492/15526 [2:55:32<1:51:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9493/15526 [2:55:33<1:51:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9493/15526 [2:55:33<1:51:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9494/15526 [2:55:34<1:51:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9494/15526 [2:55:34<1:51:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9495/15526 [2:55:35<1:51:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9495/15526 [2:55:35<1:51:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9496/15526 [2:55:36<1:51:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9496/15526 [2:55:36<1:51:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9497/15526 [2:55:36<1:51:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9497/15526 [2:55:36<1:51:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9498/15526 [2:55:37<1:51:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9498/15526 [2:55:37<1:51:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9499/15526 [2:55:38<1:51:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9499/15526 [2:55:38<1:51:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9500/15526 [2:55:39<1:51:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9500/15526 [2:55:39<1:51:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9501/15526 [2:55:40<1:51:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9501/15526 [2:55:40<1:51:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9502/15526 [2:55:41<1:51:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9502/15526 [2:55:41<1:51:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9503/15526 [2:55:42<1:51:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9503/15526 [2:55:42<1:51:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9504/15526 [2:55:51<1:51:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9504/15526 [2:55:51<1:51:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9505/15526 [2:55:52<1:51:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9505/15526 [2:55:52<1:51:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9506/15526 [2:55:53<1:51:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9506/15526 [2:55:53<1:51:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9507/15526 [2:55:53<1:51:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9507/15526 [2:55:53<1:51:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9508/15526 [2:55:54<1:51:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9508/15526 [2:55:54<1:51:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9509/15526 [2:55:55<1:51:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9509/15526 [2:55:55<1:51:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9510/15526 [2:55:56<1:51:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9510/15526 [2:55:56<1:51:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9511/15526 [2:55:56<1:51:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9511/15526 [2:55:56<1:51:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9512/15526 [2:55:58<1:51:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9512/15526 [2:55:58<1:51:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9513/15526 [2:55:58<1:51:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9513/15526 [2:55:58<1:51:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9514/15526 [2:55:59<1:51:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9514/15526 [2:55:59<1:51:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9515/15526 [2:56:00<1:51:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9515/15526 [2:56:00<1:51:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9516/15526 [2:56:01<1:51:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9516/15526 [2:56:01<1:51:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9517/15526 [2:56:01<1:51:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9517/15526 [2:56:01<1:51:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9518/15526 [2:56:02<1:51:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9518/15526 [2:56:02<1:51:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9519/15526 [2:56:03<1:51:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9519/15526 [2:56:03<1:51:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9520/15526 [2:56:03<1:51:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9520/15526 [2:56:03<1:51:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9521/15526 [2:56:05<1:51:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9521/15526 [2:56:05<1:51:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9522/15526 [2:56:05<1:51:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9522/15526 [2:56:05<1:51:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9523/15526 [2:56:06<1:51:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9523/15526 [2:56:06<1:51:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9524/15526 [2:56:07<1:50:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9524/15526 [2:56:07<1:50:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9525/15526 [2:56:08<1:50:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9525/15526 [2:56:08<1:50:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9526/15526 [2:56:09<1:50:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9526/15526 [2:56:09<1:50:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9527/15526 [2:56:10<1:50:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9527/15526 [2:56:10<1:50:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9528/15526 [2:56:11<1:50:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9528/15526 [2:56:11<1:50:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9529/15526 [2:56:12<1:50:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9529/15526 [2:56:12<1:50:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9530/15526 [2:56:12<1:50:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9530/15526 [2:56:12<1:50:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9531/15526 [2:56:13<1:50:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9531/15526 [2:56:13<1:50:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9532/15526 [2:56:14<1:50:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9532/15526 [2:56:14<1:50:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9533/15526 [2:56:14<1:50:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9533/15526 [2:56:14<1:50:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9534/15526 [2:56:15<1:50:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9534/15526 [2:56:15<1:50:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9535/15526 [2:56:16<1:50:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9535/15526 [2:56:16<1:50:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9536/15526 [2:56:25<1:50:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9536/15526 [2:56:25<1:50:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9537/15526 [2:56:26<1:50:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9537/15526 [2:56:26<1:50:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9538/15526 [2:56:27<1:50:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9538/15526 [2:56:27<1:50:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9539/15526 [2:56:29<1:50:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9539/15526 [2:56:29<1:50:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9540/15526 [2:56:29<1:50:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9540/15526 [2:56:29<1:50:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9541/15526 [2:56:30<1:50:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9541/15526 [2:56:30<1:50:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9542/15526 [2:56:31<1:50:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9542/15526 [2:56:31<1:50:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9543/15526 [2:56:31<1:50:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9543/15526 [2:56:31<1:50:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9544/15526 [2:56:32<1:50:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9544/15526 [2:56:32<1:50:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9545/15526 [2:56:33<1:50:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9545/15526 [2:56:33<1:50:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9546/15526 [2:56:33<1:50:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9546/15526 [2:56:33<1:50:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9547/15526 [2:56:34<1:50:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9547/15526 [2:56:34<1:50:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 9548/15526 [2:56:35<1:50:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  61%|▌| 9548/15526 [2:56:35<1:50:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9549/15526 [2:56:36<1:50:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9549/15526 [2:56:36<1:50:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9550/15526 [2:56:36<1:50:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9550/15526 [2:56:36<1:50:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9551/15526 [2:56:38<1:50:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9551/15526 [2:56:38<1:50:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9552/15526 [2:56:39<1:50:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9552/15526 [2:56:39<1:50:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9553/15526 [2:56:40<1:50:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9553/15526 [2:56:40<1:50:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9554/15526 [2:56:41<1:50:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9554/15526 [2:56:41<1:50:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9555/15526 [2:56:41<1:50:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9555/15526 [2:56:41<1:50:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9556/15526 [2:56:42<1:50:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9556/15526 [2:56:42<1:50:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9557/15526 [2:56:43<1:50:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9557/15526 [2:56:43<1:50:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9558/15526 [2:56:43<1:50:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9558/15526 [2:56:43<1:50:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9559/15526 [2:56:45<1:50:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9559/15526 [2:56:45<1:50:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9560/15526 [2:56:45<1:50:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9560/15526 [2:56:45<1:50:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9561/15526 [2:56:46<1:50:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9561/15526 [2:56:46<1:50:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9562/15526 [2:56:47<1:50:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9562/15526 [2:56:47<1:50:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9563/15526 [2:56:48<1:50:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9563/15526 [2:56:48<1:50:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9564/15526 [2:56:49<1:50:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9564/15526 [2:56:49<1:50:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9565/15526 [2:56:50<1:50:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9565/15526 [2:56:50<1:50:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9566/15526 [2:56:50<1:50:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9566/15526 [2:56:50<1:50:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9567/15526 [2:56:51<1:50:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9567/15526 [2:56:51<1:50:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9568/15526 [2:56:59<1:50:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9568/15526 [2:56:59<1:50:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9569/15526 [2:57:00<1:50:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9569/15526 [2:57:00<1:50:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9570/15526 [2:57:00<1:50:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9570/15526 [2:57:00<1:50:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9571/15526 [2:57:01<1:50:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9571/15526 [2:57:01<1:50:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9572/15526 [2:57:02<1:50:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9572/15526 [2:57:02<1:50:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9573/15526 [2:57:03<1:50:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9573/15526 [2:57:03<1:50:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9574/15526 [2:57:03<1:50:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9574/15526 [2:57:03<1:50:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9575/15526 [2:57:04<1:50:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9575/15526 [2:57:04<1:50:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9576/15526 [2:57:05<1:50:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9576/15526 [2:57:05<1:50:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9577/15526 [2:57:06<1:50:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9577/15526 [2:57:06<1:50:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9578/15526 [2:57:07<1:49:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9578/15526 [2:57:07<1:49:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9579/15526 [2:57:08<1:49:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9579/15526 [2:57:08<1:49:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9580/15526 [2:57:09<1:49:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9580/15526 [2:57:09<1:49:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9581/15526 [2:57:10<1:49:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9581/15526 [2:57:10<1:49:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9582/15526 [2:57:10<1:49:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9582/15526 [2:57:10<1:49:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9583/15526 [2:57:12<1:49:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9583/15526 [2:57:12<1:49:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9584/15526 [2:57:12<1:49:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9584/15526 [2:57:12<1:49:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9585/15526 [2:57:13<1:49:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9585/15526 [2:57:13<1:49:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9586/15526 [2:57:14<1:49:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9586/15526 [2:57:14<1:49:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9587/15526 [2:57:14<1:49:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9587/15526 [2:57:14<1:49:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9588/15526 [2:57:15<1:49:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9588/15526 [2:57:15<1:49:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9589/15526 [2:57:16<1:49:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9589/15526 [2:57:16<1:49:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9590/15526 [2:57:17<1:49:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9590/15526 [2:57:17<1:49:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9591/15526 [2:57:18<1:49:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9591/15526 [2:57:18<1:49:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9592/15526 [2:57:19<1:49:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9592/15526 [2:57:19<1:49:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9593/15526 [2:57:20<1:49:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9593/15526 [2:57:20<1:49:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9594/15526 [2:57:20<1:49:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9594/15526 [2:57:20<1:49:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9595/15526 [2:57:22<1:49:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9595/15526 [2:57:22<1:49:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9596/15526 [2:57:23<1:49:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9596/15526 [2:57:23<1:49:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9597/15526 [2:57:24<1:49:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9597/15526 [2:57:24<1:49:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9598/15526 [2:57:25<1:49:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9598/15526 [2:57:25<1:49:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9599/15526 [2:57:26<1:49:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9599/15526 [2:57:26<1:49:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9600/15526 [2:57:35<1:49:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9600/15526 [2:57:35<1:49:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9601/15526 [2:57:57<1:49:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9601/15526 [2:57:57<1:49:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9602/15526 [2:57:59<1:49:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9602/15526 [2:57:59<1:49:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9603/15526 [2:58:00<1:49:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9603/15526 [2:58:00<1:49:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9604/15526 [2:58:00<1:49:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9604/15526 [2:58:00<1:49:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9605/15526 [2:58:02<1:49:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9605/15526 [2:58:02<1:49:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9606/15526 [2:58:03<1:49:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9606/15526 [2:58:03<1:49:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9607/15526 [2:58:04<1:49:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9607/15526 [2:58:04<1:49:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9608/15526 [2:58:05<1:49:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9608/15526 [2:58:05<1:49:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9609/15526 [2:58:05<1:49:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9609/15526 [2:58:05<1:49:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9610/15526 [2:58:06<1:49:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9610/15526 [2:58:06<1:49:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9611/15526 [2:58:07<1:49:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9611/15526 [2:58:07<1:49:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9612/15526 [2:58:07<1:49:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9612/15526 [2:58:07<1:49:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9613/15526 [2:58:08<1:49:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9613/15526 [2:58:08<1:49:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9614/15526 [2:58:09<1:49:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9614/15526 [2:58:09<1:49:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9615/15526 [2:58:09<1:49:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9615/15526 [2:58:09<1:49:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9616/15526 [2:58:10<1:49:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9616/15526 [2:58:10<1:49:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9617/15526 [2:58:11<1:49:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9617/15526 [2:58:11<1:49:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9618/15526 [2:58:12<1:49:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9618/15526 [2:58:12<1:49:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9619/15526 [2:58:13<1:49:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9619/15526 [2:58:13<1:49:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9620/15526 [2:58:13<1:49:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9620/15526 [2:58:13<1:49:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9621/15526 [2:58:14<1:49:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9621/15526 [2:58:14<1:49:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9622/15526 [2:58:15<1:49:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9622/15526 [2:58:15<1:49:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9623/15526 [2:58:15<1:49:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9623/15526 [2:58:15<1:49:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9624/15526 [2:58:17<1:49:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9624/15526 [2:58:17<1:49:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9625/15526 [2:58:18<1:49:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9625/15526 [2:58:18<1:49:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9626/15526 [2:58:19<1:49:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9626/15526 [2:58:19<1:49:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9627/15526 [2:58:20<1:49:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9627/15526 [2:58:20<1:49:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9628/15526 [2:58:21<1:49:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9628/15526 [2:58:21<1:49:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9629/15526 [2:58:22<1:49:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9629/15526 [2:58:22<1:49:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9630/15526 [2:58:23<1:49:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9630/15526 [2:58:23<1:49:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9631/15526 [2:58:24<1:49:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9631/15526 [2:58:24<1:49:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9632/15526 [2:58:33<1:49:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9632/15526 [2:58:33<1:49:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9633/15526 [2:58:33<1:49:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9633/15526 [2:58:33<1:49:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9634/15526 [2:58:34<1:49:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9634/15526 [2:58:34<1:49:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9635/15526 [2:58:35<1:49:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9635/15526 [2:58:35<1:49:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9636/15526 [2:58:36<1:49:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9636/15526 [2:58:36<1:49:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9637/15526 [2:58:37<1:49:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9637/15526 [2:58:37<1:49:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9638/15526 [2:58:38<1:49:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9638/15526 [2:58:38<1:49:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9639/15526 [2:58:39<1:49:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9639/15526 [2:58:39<1:49:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9640/15526 [2:58:39<1:49:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9640/15526 [2:58:39<1:49:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9641/15526 [2:58:40<1:49:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9641/15526 [2:58:40<1:49:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9642/15526 [2:58:41<1:49:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9642/15526 [2:58:41<1:49:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9643/15526 [2:58:42<1:49:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9643/15526 [2:58:42<1:49:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9644/15526 [2:58:43<1:49:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9644/15526 [2:58:43<1:49:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9645/15526 [2:58:43<1:48:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9645/15526 [2:58:43<1:48:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9646/15526 [2:58:44<1:48:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9646/15526 [2:58:44<1:48:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9647/15526 [2:58:45<1:48:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9647/15526 [2:58:45<1:48:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9648/15526 [2:58:46<1:48:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9648/15526 [2:58:46<1:48:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9649/15526 [2:58:47<1:48:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9649/15526 [2:58:47<1:48:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9650/15526 [2:58:48<1:48:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9650/15526 [2:58:48<1:48:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9651/15526 [2:58:48<1:48:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9651/15526 [2:58:48<1:48:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9652/15526 [2:58:50<1:48:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9652/15526 [2:58:50<1:48:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9653/15526 [2:58:51<1:48:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9653/15526 [2:58:51<1:48:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9654/15526 [2:58:51<1:48:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9654/15526 [2:58:51<1:48:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9655/15526 [2:58:52<1:48:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9655/15526 [2:58:52<1:48:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9656/15526 [2:58:53<1:48:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9656/15526 [2:58:53<1:48:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9657/15526 [2:58:54<1:48:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9657/15526 [2:58:54<1:48:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9658/15526 [2:58:55<1:48:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9658/15526 [2:58:55<1:48:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9659/15526 [2:58:55<1:48:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9659/15526 [2:58:55<1:48:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9660/15526 [2:58:56<1:48:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9660/15526 [2:58:56<1:48:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9661/15526 [2:58:57<1:48:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9661/15526 [2:58:57<1:48:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9662/15526 [2:58:58<1:48:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9662/15526 [2:58:58<1:48:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9663/15526 [2:58:59<1:48:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9663/15526 [2:58:59<1:48:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9664/15526 [2:59:07<1:48:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9664/15526 [2:59:07<1:48:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9665/15526 [2:59:07<1:48:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9665/15526 [2:59:07<1:48:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9666/15526 [2:59:09<1:48:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9666/15526 [2:59:09<1:48:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9667/15526 [2:59:09<1:48:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9667/15526 [2:59:09<1:48:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9668/15526 [2:59:10<1:48:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9668/15526 [2:59:10<1:48:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9669/15526 [2:59:11<1:48:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9669/15526 [2:59:11<1:48:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9670/15526 [2:59:12<1:48:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9670/15526 [2:59:12<1:48:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9671/15526 [2:59:13<1:48:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9671/15526 [2:59:13<1:48:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9672/15526 [2:59:13<1:48:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9672/15526 [2:59:13<1:48:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9673/15526 [2:59:14<1:48:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9673/15526 [2:59:14<1:48:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9674/15526 [2:59:15<1:48:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9674/15526 [2:59:15<1:48:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9675/15526 [2:59:16<1:48:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9675/15526 [2:59:16<1:48:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9676/15526 [2:59:17<1:48:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9676/15526 [2:59:17<1:48:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9677/15526 [2:59:18<1:48:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9677/15526 [2:59:18<1:48:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9678/15526 [2:59:19<1:48:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9678/15526 [2:59:19<1:48:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9679/15526 [2:59:20<1:48:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9679/15526 [2:59:20<1:48:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9680/15526 [2:59:21<1:48:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9680/15526 [2:59:21<1:48:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9681/15526 [2:59:21<1:48:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9681/15526 [2:59:21<1:48:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9682/15526 [2:59:23<1:48:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9682/15526 [2:59:23<1:48:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9683/15526 [2:59:24<1:48:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9683/15526 [2:59:24<1:48:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9684/15526 [2:59:25<1:48:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9684/15526 [2:59:25<1:48:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9685/15526 [2:59:26<1:48:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9685/15526 [2:59:26<1:48:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9686/15526 [2:59:26<1:48:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9686/15526 [2:59:26<1:48:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9687/15526 [2:59:28<1:48:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9687/15526 [2:59:28<1:48:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9688/15526 [2:59:28<1:48:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9688/15526 [2:59:28<1:48:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9689/15526 [2:59:30<1:48:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9689/15526 [2:59:30<1:48:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9690/15526 [2:59:31<1:48:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9690/15526 [2:59:31<1:48:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9691/15526 [2:59:31<1:48:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9691/15526 [2:59:31<1:48:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9692/15526 [2:59:32<1:48:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9692/15526 [2:59:32<1:48:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9693/15526 [2:59:33<1:48:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9693/15526 [2:59:33<1:48:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9694/15526 [2:59:33<1:48:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9694/15526 [2:59:33<1:48:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9695/15526 [2:59:35<1:48:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9695/15526 [2:59:35<1:48:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9696/15526 [2:59:41<1:48:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9696/15526 [2:59:41<1:48:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9697/15526 [2:59:41<1:48:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9697/15526 [2:59:41<1:48:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9698/15526 [2:59:42<1:47:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9698/15526 [2:59:42<1:47:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9699/15526 [2:59:43<1:47:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9699/15526 [2:59:43<1:47:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9700/15526 [2:59:44<1:47:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9700/15526 [2:59:44<1:47:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9701/15526 [2:59:45<1:47:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9701/15526 [2:59:45<1:47:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9702/15526 [2:59:45<1:47:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9702/15526 [2:59:45<1:47:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 9703/15526 [2:59:47<1:47:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  62%|▌| 9703/15526 [2:59:47<1:47:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9704/15526 [2:59:48<1:47:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9704/15526 [2:59:48<1:47:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9705/15526 [2:59:48<1:47:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9705/15526 [2:59:48<1:47:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9706/15526 [2:59:50<1:47:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9706/15526 [2:59:50<1:47:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9707/15526 [2:59:51<1:47:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9707/15526 [2:59:51<1:47:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9708/15526 [2:59:52<1:47:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9708/15526 [2:59:52<1:47:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9709/15526 [2:59:53<1:47:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9709/15526 [2:59:53<1:47:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9710/15526 [2:59:54<1:47:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9710/15526 [2:59:54<1:47:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9711/15526 [2:59:54<1:47:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9711/15526 [2:59:54<1:47:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9712/15526 [2:59:55<1:47:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9712/15526 [2:59:55<1:47:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9713/15526 [2:59:56<1:47:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9713/15526 [2:59:56<1:47:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9714/15526 [2:59:56<1:47:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9714/15526 [2:59:56<1:47:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9715/15526 [2:59:57<1:47:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9715/15526 [2:59:57<1:47:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9716/15526 [2:59:58<1:47:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9716/15526 [2:59:58<1:47:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9717/15526 [2:59:58<1:47:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9717/15526 [2:59:58<1:47:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9718/15526 [3:00:00<1:47:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9718/15526 [3:00:00<1:47:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9719/15526 [3:00:00<1:47:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9719/15526 [3:00:00<1:47:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9720/15526 [3:00:01<1:47:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9720/15526 [3:00:01<1:47:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9721/15526 [3:00:02<1:47:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9721/15526 [3:00:02<1:47:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9722/15526 [3:00:02<1:47:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9722/15526 [3:00:02<1:47:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9723/15526 [3:00:03<1:47:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9723/15526 [3:00:03<1:47:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9724/15526 [3:00:04<1:47:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9724/15526 [3:00:04<1:47:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9725/15526 [3:00:06<1:47:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9725/15526 [3:00:06<1:47:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9726/15526 [3:00:06<1:47:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9726/15526 [3:00:06<1:47:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9727/15526 [3:00:07<1:47:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9727/15526 [3:00:07<1:47:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9728/15526 [3:00:14<1:47:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9728/15526 [3:00:14<1:47:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9729/15526 [3:00:15<1:47:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9729/15526 [3:00:15<1:47:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9730/15526 [3:00:16<1:47:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9730/15526 [3:00:16<1:47:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9731/15526 [3:00:17<1:47:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9731/15526 [3:00:17<1:47:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9732/15526 [3:00:18<1:47:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9732/15526 [3:00:18<1:47:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9733/15526 [3:00:19<1:47:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9733/15526 [3:00:19<1:47:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9734/15526 [3:00:20<1:47:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9734/15526 [3:00:20<1:47:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9735/15526 [3:00:22<1:47:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9735/15526 [3:00:22<1:47:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9736/15526 [3:00:22<1:47:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9736/15526 [3:00:22<1:47:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9737/15526 [3:00:23<1:47:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9737/15526 [3:00:23<1:47:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9738/15526 [3:00:25<1:47:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9738/15526 [3:00:25<1:47:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9739/15526 [3:00:26<1:47:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9739/15526 [3:00:26<1:47:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9740/15526 [3:00:27<1:47:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9740/15526 [3:00:27<1:47:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9741/15526 [3:00:27<1:47:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9741/15526 [3:00:27<1:47:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9742/15526 [3:00:28<1:47:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9742/15526 [3:00:28<1:47:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9743/15526 [3:00:29<1:47:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9743/15526 [3:00:29<1:47:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9744/15526 [3:00:29<1:47:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9744/15526 [3:00:29<1:47:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9745/15526 [3:00:31<1:47:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9745/15526 [3:00:31<1:47:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9746/15526 [3:00:31<1:47:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9746/15526 [3:00:31<1:47:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9747/15526 [3:00:32<1:47:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9747/15526 [3:00:32<1:47:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9748/15526 [3:00:33<1:47:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9748/15526 [3:00:33<1:47:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9749/15526 [3:00:34<1:47:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9749/15526 [3:00:34<1:47:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9750/15526 [3:00:35<1:46:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9750/15526 [3:00:35<1:46:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9751/15526 [3:00:36<1:46:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9751/15526 [3:00:36<1:46:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9752/15526 [3:00:36<1:46:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9752/15526 [3:00:36<1:46:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9753/15526 [3:00:37<1:46:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9753/15526 [3:00:37<1:46:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9754/15526 [3:00:38<1:46:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9754/15526 [3:00:38<1:46:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9755/15526 [3:00:38<1:46:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9755/15526 [3:00:38<1:46:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9756/15526 [3:00:39<1:46:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9756/15526 [3:00:39<1:46:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9757/15526 [3:00:40<1:46:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9757/15526 [3:00:40<1:46:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9758/15526 [3:00:40<1:46:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9758/15526 [3:00:40<1:46:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9759/15526 [3:00:41<1:46:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9759/15526 [3:00:41<1:46:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9760/15526 [3:00:48<1:46:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9760/15526 [3:00:48<1:46:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9761/15526 [3:00:49<1:46:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9761/15526 [3:00:49<1:46:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9762/15526 [3:00:50<1:46:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9762/15526 [3:00:50<1:46:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9763/15526 [3:00:50<1:46:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9763/15526 [3:00:50<1:46:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9764/15526 [3:00:52<1:46:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9764/15526 [3:00:52<1:46:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9765/15526 [3:00:53<1:46:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9765/15526 [3:00:53<1:46:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9766/15526 [3:00:54<1:46:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9766/15526 [3:00:54<1:46:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9767/15526 [3:00:55<1:46:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9767/15526 [3:00:55<1:46:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9768/15526 [3:00:55<1:46:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9768/15526 [3:00:55<1:46:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9769/15526 [3:00:56<1:46:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9769/15526 [3:00:56<1:46:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9770/15526 [3:00:57<1:46:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9770/15526 [3:00:57<1:46:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9771/15526 [3:00:58<1:46:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9771/15526 [3:00:58<1:46:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9772/15526 [3:00:59<1:46:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9772/15526 [3:00:59<1:46:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9773/15526 [3:01:00<1:46:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9773/15526 [3:01:00<1:46:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9774/15526 [3:01:01<1:46:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9774/15526 [3:01:01<1:46:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9775/15526 [3:01:02<1:46:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9775/15526 [3:01:02<1:46:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9776/15526 [3:01:03<1:46:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9776/15526 [3:01:03<1:46:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9777/15526 [3:01:03<1:46:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9777/15526 [3:01:03<1:46:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9778/15526 [3:01:04<1:46:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9778/15526 [3:01:04<1:46:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9779/15526 [3:01:05<1:46:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9779/15526 [3:01:05<1:46:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9780/15526 [3:01:06<1:46:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9780/15526 [3:01:06<1:46:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9781/15526 [3:01:07<1:46:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9781/15526 [3:01:07<1:46:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9782/15526 [3:01:08<1:46:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9782/15526 [3:01:08<1:46:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9783/15526 [3:01:08<1:46:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9783/15526 [3:01:08<1:46:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9784/15526 [3:01:10<1:46:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9784/15526 [3:01:10<1:46:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9785/15526 [3:01:10<1:46:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9785/15526 [3:01:10<1:46:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9786/15526 [3:01:11<1:46:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9786/15526 [3:01:11<1:46:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9787/15526 [3:01:12<1:46:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9787/15526 [3:01:12<1:46:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9788/15526 [3:01:13<1:46:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9788/15526 [3:01:13<1:46:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9789/15526 [3:01:14<1:46:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9789/15526 [3:01:14<1:46:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9790/15526 [3:01:14<1:46:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9790/15526 [3:01:14<1:46:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9791/15526 [3:01:15<1:46:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9791/15526 [3:01:15<1:46:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9792/15526 [3:01:24<1:46:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9792/15526 [3:01:24<1:46:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9793/15526 [3:01:24<1:46:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9793/15526 [3:01:24<1:46:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9794/15526 [3:01:25<1:46:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9794/15526 [3:01:25<1:46:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9795/15526 [3:01:26<1:46:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9795/15526 [3:01:26<1:46:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9796/15526 [3:01:27<1:46:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9796/15526 [3:01:27<1:46:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9797/15526 [3:01:28<1:46:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9797/15526 [3:01:28<1:46:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9798/15526 [3:01:29<1:46:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9798/15526 [3:01:29<1:46:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9799/15526 [3:01:30<1:46:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9799/15526 [3:01:30<1:46:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9800/15526 [3:01:31<1:46:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9800/15526 [3:01:31<1:46:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9801/15526 [3:01:32<1:46:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9801/15526 [3:01:32<1:46:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9802/15526 [3:01:33<1:46:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9802/15526 [3:01:33<1:46:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9803/15526 [3:01:34<1:45:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9803/15526 [3:01:34<1:45:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9804/15526 [3:01:34<1:45:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9804/15526 [3:01:34<1:45:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9805/15526 [3:01:35<1:45:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9805/15526 [3:01:35<1:45:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9806/15526 [3:01:36<1:45:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9806/15526 [3:01:36<1:45:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9807/15526 [3:01:37<1:45:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9807/15526 [3:01:37<1:45:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9808/15526 [3:01:37<1:45:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9808/15526 [3:01:37<1:45:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9809/15526 [3:01:39<1:45:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9809/15526 [3:01:39<1:45:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9810/15526 [3:01:39<1:45:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9810/15526 [3:01:39<1:45:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9811/15526 [3:01:40<1:45:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9811/15526 [3:01:40<1:45:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9812/15526 [3:01:41<1:45:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9812/15526 [3:01:41<1:45:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9813/15526 [3:01:41<1:45:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9813/15526 [3:01:41<1:45:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9814/15526 [3:01:42<1:45:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9814/15526 [3:01:42<1:45:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9815/15526 [3:01:43<1:45:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9815/15526 [3:01:43<1:45:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9816/15526 [3:01:44<1:45:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9816/15526 [3:01:44<1:45:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9817/15526 [3:01:45<1:45:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9817/15526 [3:01:45<1:45:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9818/15526 [3:01:45<1:45:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9818/15526 [3:01:45<1:45:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9819/15526 [3:01:46<1:45:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9819/15526 [3:01:46<1:45:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9820/15526 [3:01:47<1:45:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9820/15526 [3:01:47<1:45:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9821/15526 [3:01:47<1:45:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9821/15526 [3:01:47<1:45:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9822/15526 [3:01:48<1:45:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9822/15526 [3:01:48<1:45:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9823/15526 [3:01:49<1:45:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9823/15526 [3:01:49<1:45:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9824/15526 [3:01:59<1:45:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9824/15526 [3:01:59<1:45:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9825/15526 [3:01:59<1:45:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9825/15526 [3:01:59<1:45:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9826/15526 [3:02:00<1:45:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9826/15526 [3:02:00<1:45:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9827/15526 [3:02:01<1:45:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9827/15526 [3:02:01<1:45:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9828/15526 [3:02:02<1:45:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9828/15526 [3:02:02<1:45:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9829/15526 [3:02:03<1:45:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9829/15526 [3:02:03<1:45:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9830/15526 [3:02:03<1:45:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9830/15526 [3:02:03<1:45:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9831/15526 [3:02:04<1:45:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9831/15526 [3:02:04<1:45:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9832/15526 [3:02:05<1:45:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9832/15526 [3:02:05<1:45:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9833/15526 [3:02:05<1:45:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9833/15526 [3:02:05<1:45:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9834/15526 [3:02:06<1:45:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9834/15526 [3:02:06<1:45:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9835/15526 [3:02:07<1:45:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9835/15526 [3:02:07<1:45:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9836/15526 [3:02:08<1:45:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9836/15526 [3:02:08<1:45:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9837/15526 [3:02:08<1:45:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9837/15526 [3:02:08<1:45:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9838/15526 [3:02:10<1:45:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9838/15526 [3:02:10<1:45:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9839/15526 [3:02:11<1:45:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9839/15526 [3:02:11<1:45:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9840/15526 [3:02:12<1:45:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9840/15526 [3:02:12<1:45:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9841/15526 [3:02:12<1:45:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9841/15526 [3:02:12<1:45:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9842/15526 [3:02:13<1:45:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9842/15526 [3:02:13<1:45:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9843/15526 [3:02:14<1:45:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9843/15526 [3:02:14<1:45:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9844/15526 [3:02:15<1:45:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9844/15526 [3:02:15<1:45:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9845/15526 [3:02:16<1:45:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9845/15526 [3:02:16<1:45:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9846/15526 [3:02:17<1:45:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9846/15526 [3:02:17<1:45:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9847/15526 [3:02:18<1:45:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9847/15526 [3:02:18<1:45:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9848/15526 [3:02:18<1:45:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9848/15526 [3:02:18<1:45:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9849/15526 [3:02:19<1:45:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9849/15526 [3:02:19<1:45:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9850/15526 [3:02:20<1:45:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9850/15526 [3:02:20<1:45:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9851/15526 [3:02:21<1:45:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9851/15526 [3:02:21<1:45:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9852/15526 [3:02:22<1:45:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9852/15526 [3:02:22<1:45:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9853/15526 [3:02:23<1:45:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9853/15526 [3:02:23<1:45:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9854/15526 [3:02:24<1:44:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9854/15526 [3:02:24<1:44:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9855/15526 [3:02:25<1:44:58,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9855/15526 [3:02:25<1:44:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9856/15526 [3:02:34<1:45:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9856/15526 [3:02:34<1:45:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9857/15526 [3:02:35<1:45:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9857/15526 [3:02:35<1:45:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9858/15526 [3:02:35<1:44:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9858/15526 [3:02:35<1:44:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 9859/15526 [3:02:36<1:44:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  63%|▋| 9859/15526 [3:02:36<1:44:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9860/15526 [3:02:37<1:44:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9860/15526 [3:02:37<1:44:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9861/15526 [3:02:37<1:44:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9861/15526 [3:02:37<1:44:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9862/15526 [3:02:39<1:44:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9862/15526 [3:02:39<1:44:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9863/15526 [3:02:39<1:44:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9863/15526 [3:02:39<1:44:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9864/15526 [3:02:41<1:44:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9864/15526 [3:02:41<1:44:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9865/15526 [3:02:41<1:44:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9865/15526 [3:02:41<1:44:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9866/15526 [3:02:42<1:44:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9866/15526 [3:02:42<1:44:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9867/15526 [3:02:43<1:44:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9867/15526 [3:02:43<1:44:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9868/15526 [3:02:44<1:44:46,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9868/15526 [3:02:44<1:44:46,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9869/15526 [3:02:45<1:44:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9869/15526 [3:02:45<1:44:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9870/15526 [3:02:45<1:44:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9870/15526 [3:02:45<1:44:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9871/15526 [3:02:46<1:44:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9871/15526 [3:02:46<1:44:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9872/15526 [3:02:47<1:44:41,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9872/15526 [3:02:47<1:44:41,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9873/15526 [3:02:48<1:44:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9873/15526 [3:02:48<1:44:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9874/15526 [3:02:49<1:44:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9874/15526 [3:02:49<1:44:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9875/15526 [3:02:50<1:44:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9875/15526 [3:02:50<1:44:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9876/15526 [3:02:50<1:44:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9876/15526 [3:02:50<1:44:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9877/15526 [3:02:51<1:44:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9877/15526 [3:02:51<1:44:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9878/15526 [3:02:52<1:44:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9878/15526 [3:02:52<1:44:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9879/15526 [3:02:52<1:44:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9879/15526 [3:02:52<1:44:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9880/15526 [3:02:54<1:44:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9880/15526 [3:02:54<1:44:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9881/15526 [3:02:54<1:44:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9881/15526 [3:02:54<1:44:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9882/15526 [3:02:56<1:44:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9882/15526 [3:02:56<1:44:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9883/15526 [3:02:56<1:44:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9883/15526 [3:02:56<1:44:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9884/15526 [3:02:57<1:44:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9884/15526 [3:02:57<1:44:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9885/15526 [3:02:58<1:44:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9885/15526 [3:02:58<1:44:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9886/15526 [3:02:59<1:44:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9886/15526 [3:02:59<1:44:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9887/15526 [3:03:00<1:44:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9887/15526 [3:03:00<1:44:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9888/15526 [3:03:09<1:44:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9888/15526 [3:03:09<1:44:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9889/15526 [3:03:10<1:44:24,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9889/15526 [3:03:10<1:44:24,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9890/15526 [3:03:11<1:44:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9890/15526 [3:03:11<1:44:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9891/15526 [3:03:12<1:44:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9891/15526 [3:03:12<1:44:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9892/15526 [3:03:13<1:44:21,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9892/15526 [3:03:13<1:44:21,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9893/15526 [3:03:14<1:44:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9893/15526 [3:03:14<1:44:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9894/15526 [3:03:14<1:44:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9894/15526 [3:03:14<1:44:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9895/15526 [3:03:15<1:44:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9895/15526 [3:03:15<1:44:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9896/15526 [3:03:16<1:44:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9896/15526 [3:03:16<1:44:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9897/15526 [3:03:17<1:44:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9897/15526 [3:03:17<1:44:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9898/15526 [3:03:19<1:44:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9898/15526 [3:03:19<1:44:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9899/15526 [3:03:19<1:44:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9899/15526 [3:03:19<1:44:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9900/15526 [3:03:20<1:44:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9900/15526 [3:03:20<1:44:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9901/15526 [3:03:22<1:44:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9901/15526 [3:03:22<1:44:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9902/15526 [3:03:22<1:44:09,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9902/15526 [3:03:22<1:44:09,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9903/15526 [3:03:24<1:44:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9903/15526 [3:03:24<1:44:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9904/15526 [3:03:24<1:44:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9904/15526 [3:03:24<1:44:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9905/15526 [3:03:25<1:44:05,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9905/15526 [3:03:25<1:44:05,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9906/15526 [3:03:26<1:44:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9906/15526 [3:03:26<1:44:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9907/15526 [3:03:27<1:44:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9907/15526 [3:03:27<1:44:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9908/15526 [3:03:28<1:44:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9908/15526 [3:03:28<1:44:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9909/15526 [3:03:29<1:44:00,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9909/15526 [3:03:29<1:44:00,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9910/15526 [3:03:29<1:43:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9910/15526 [3:03:29<1:43:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9911/15526 [3:03:30<1:43:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9911/15526 [3:03:30<1:43:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9912/15526 [3:03:31<1:43:56,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9912/15526 [3:03:31<1:43:56,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9913/15526 [3:03:31<1:43:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9913/15526 [3:03:31<1:43:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9914/15526 [3:03:32<1:43:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9914/15526 [3:03:32<1:43:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9915/15526 [3:03:33<1:43:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9915/15526 [3:03:33<1:43:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9916/15526 [3:03:33<1:43:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9916/15526 [3:03:33<1:43:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9917/15526 [3:03:35<1:43:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9917/15526 [3:03:35<1:43:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9918/15526 [3:03:35<1:43:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9918/15526 [3:03:35<1:43:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9919/15526 [3:03:36<1:43:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9919/15526 [3:03:36<1:43:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9920/15526 [3:03:45<1:43:50,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9920/15526 [3:03:45<1:43:50,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9921/15526 [3:03:46<1:43:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9921/15526 [3:03:46<1:43:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9922/15526 [3:03:47<1:43:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9922/15526 [3:03:47<1:43:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9923/15526 [3:03:48<1:43:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9923/15526 [3:03:48<1:43:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9924/15526 [3:03:49<1:43:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9924/15526 [3:03:49<1:43:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9925/15526 [3:03:50<1:43:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9925/15526 [3:03:50<1:43:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9926/15526 [3:03:50<1:43:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9926/15526 [3:03:50<1:43:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9927/15526 [3:03:51<1:43:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9927/15526 [3:03:51<1:43:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9928/15526 [3:03:52<1:43:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9928/15526 [3:03:52<1:43:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9929/15526 [3:03:53<1:43:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9929/15526 [3:03:53<1:43:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9930/15526 [3:03:54<1:43:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9930/15526 [3:03:54<1:43:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9931/15526 [3:03:54<1:43:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9931/15526 [3:03:54<1:43:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9932/15526 [3:03:55<1:43:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9932/15526 [3:03:55<1:43:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9933/15526 [3:03:56<1:43:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9933/15526 [3:03:56<1:43:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9934/15526 [3:03:56<1:43:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9934/15526 [3:03:56<1:43:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9935/15526 [3:03:57<1:43:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9935/15526 [3:03:57<1:43:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9936/15526 [3:03:58<1:43:30,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9936/15526 [3:03:58<1:43:30,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9937/15526 [3:03:58<1:43:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9937/15526 [3:03:58<1:43:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9938/15526 [3:04:00<1:43:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9938/15526 [3:04:00<1:43:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9939/15526 [3:04:00<1:43:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9939/15526 [3:04:00<1:43:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9940/15526 [3:04:01<1:43:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9940/15526 [3:04:01<1:43:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9941/15526 [3:04:02<1:43:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9941/15526 [3:04:02<1:43:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9942/15526 [3:04:02<1:43:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9942/15526 [3:04:02<1:43:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9943/15526 [3:04:03<1:43:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9943/15526 [3:04:03<1:43:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9944/15526 [3:04:04<1:43:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9944/15526 [3:04:04<1:43:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9945/15526 [3:04:05<1:43:18,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9945/15526 [3:04:05<1:43:18,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9946/15526 [3:04:06<1:43:17,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9946/15526 [3:04:06<1:43:17,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9947/15526 [3:04:07<1:43:16,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9947/15526 [3:04:07<1:43:16,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9948/15526 [3:04:07<1:43:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9948/15526 [3:04:07<1:43:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9949/15526 [3:04:08<1:43:13,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9949/15526 [3:04:08<1:43:13,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9950/15526 [3:04:09<1:43:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9950/15526 [3:04:09<1:43:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9951/15526 [3:04:10<1:43:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9951/15526 [3:04:10<1:43:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9952/15526 [3:04:20<1:43:15,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9952/15526 [3:04:20<1:43:15,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9953/15526 [3:04:22<1:43:14,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9953/15526 [3:04:22<1:43:14,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9954/15526 [3:04:23<1:43:12,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9954/15526 [3:04:23<1:43:12,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9955/15526 [3:04:23<1:43:11,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9955/15526 [3:04:23<1:43:11,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9956/15526 [3:04:24<1:43:10,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9956/15526 [3:04:24<1:43:10,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9957/15526 [3:04:25<1:43:08,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9957/15526 [3:04:25<1:43:08,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9958/15526 [3:04:25<1:43:07,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9958/15526 [3:04:25<1:43:07,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9959/15526 [3:04:26<1:43:06,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9959/15526 [3:04:26<1:43:06,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9960/15526 [3:04:27<1:43:04,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9960/15526 [3:04:27<1:43:04,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9961/15526 [3:04:28<1:43:03,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9961/15526 [3:04:28<1:43:03,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9962/15526 [3:04:28<1:43:02,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9962/15526 [3:04:28<1:43:02,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9963/15526 [3:04:29<1:43:01,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9963/15526 [3:04:29<1:43:01,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9964/15526 [3:04:30<1:42:59,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9964/15526 [3:04:30<1:42:59,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9965/15526 [3:04:31<1:42:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9965/15526 [3:04:31<1:42:58,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9966/15526 [3:04:31<1:42:57,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9966/15526 [3:04:31<1:42:57,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9967/15526 [3:04:33<1:42:55,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9967/15526 [3:04:33<1:42:55,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9968/15526 [3:04:34<1:42:54,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9968/15526 [3:04:34<1:42:54,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9969/15526 [3:04:35<1:42:53,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9969/15526 [3:04:35<1:42:53,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9970/15526 [3:04:36<1:42:52,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9970/15526 [3:04:36<1:42:52,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9971/15526 [3:04:36<1:42:51,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9971/15526 [3:04:36<1:42:51,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9972/15526 [3:04:37<1:42:49,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9972/15526 [3:04:37<1:42:49,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9973/15526 [3:04:38<1:42:48,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9973/15526 [3:04:38<1:42:48,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9974/15526 [3:04:39<1:42:47,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9974/15526 [3:04:39<1:42:47,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9975/15526 [3:04:39<1:42:45,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9975/15526 [3:04:39<1:42:45,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9976/15526 [3:04:40<1:42:44,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9976/15526 [3:04:40<1:42:44,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9977/15526 [3:04:41<1:42:43,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9977/15526 [3:04:41<1:42:43,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9978/15526 [3:04:42<1:42:42,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9978/15526 [3:04:42<1:42:42,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9979/15526 [3:04:42<1:42:40,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9979/15526 [3:04:42<1:42:40,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9980/15526 [3:04:44<1:42:39,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9980/15526 [3:04:44<1:42:39,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9981/15526 [3:04:44<1:42:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9981/15526 [3:04:44<1:42:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9982/15526 [3:04:46<1:42:37,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9982/15526 [3:04:46<1:42:37,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9983/15526 [3:04:47<1:42:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9983/15526 [3:04:47<1:42:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9984/15526 [3:04:54<1:42:38,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9984/15526 [3:04:54<1:42:38,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9985/15526 [3:04:55<1:42:36,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9985/15526 [3:04:55<1:42:36,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9986/15526 [3:04:55<1:42:35,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9986/15526 [3:04:55<1:42:35,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9987/15526 [3:04:56<1:42:34,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9987/15526 [3:04:56<1:42:34,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9988/15526 [3:04:57<1:42:33,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9988/15526 [3:04:57<1:42:33,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9989/15526 [3:04:58<1:42:32,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9989/15526 [3:04:58<1:42:32,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9990/15526 [3:04:59<1:42:31,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9990/15526 [3:04:59<1:42:31,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9991/15526 [3:05:00<1:42:29,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9991/15526 [3:05:00<1:42:29,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9992/15526 [3:05:01<1:42:28,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9992/15526 [3:05:01<1:42:28,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9993/15526 [3:05:02<1:42:27,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9993/15526 [3:05:02<1:42:27,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9994/15526 [3:05:03<1:42:26,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9994/15526 [3:05:03<1:42:26,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9995/15526 [3:05:04<1:42:25,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9995/15526 [3:05:04<1:42:25,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9996/15526 [3:05:05<1:42:23,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9996/15526 [3:05:05<1:42:23,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9997/15526 [3:05:05<1:42:22,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9997/15526 [3:05:05<1:42:22,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9998/15526 [3:05:06<1:42:20,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9998/15526 [3:05:06<1:42:20,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 9999/15526 [3:05:07<1:42:19,  1.11s/it, v_num=73vx, train/loss=\r",
-      "Epoch 0:  64%|▋| 9999/15526 [3:05:07<1:42:19,  1.11s/it, v_num=73vx, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 10000/15526 [3:05:08<1:42:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  64%|▋| 10000/15526 [3:05:08<1:42:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 10001/15526 [3:05:09<1:42:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 10001/15526 [3:05:09<1:42:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 10002/15526 [3:05:09<1:42:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  64%|▋| 10002/15526 [3:05:09<1:42:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 10003/15526 [3:05:11<1:42:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  64%|▋| 10003/15526 [3:05:11<1:42:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 10004/15526 [3:05:11<1:42:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  64%|▋| 10004/15526 [3:05:11<1:42:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 10005/15526 [3:05:12<1:42:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  64%|▋| 10005/15526 [3:05:12<1:42:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 10006/15526 [3:05:13<1:42:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  64%|▋| 10006/15526 [3:05:13<1:42:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 10007/15526 [3:05:14<1:42:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  64%|▋| 10007/15526 [3:05:14<1:42:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 10008/15526 [3:05:15<1:42:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  64%|▋| 10008/15526 [3:05:15<1:42:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 10009/15526 [3:05:15<1:42:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  64%|▋| 10009/15526 [3:05:15<1:42:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 10010/15526 [3:05:16<1:42:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  64%|▋| 10010/15526 [3:05:16<1:42:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 10011/15526 [3:05:17<1:42:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  64%|▋| 10011/15526 [3:05:17<1:42:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 10012/15526 [3:05:17<1:42:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  64%|▋| 10012/15526 [3:05:17<1:42:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 10013/15526 [3:05:19<1:42:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  64%|▋| 10013/15526 [3:05:19<1:42:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 10014/15526 [3:05:19<1:42:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  64%|▋| 10014/15526 [3:05:19<1:42:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10015/15526 [3:05:20<1:41:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10015/15526 [3:05:20<1:41:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10016/15526 [3:05:28<1:42:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10016/15526 [3:05:28<1:42:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10017/15526 [3:05:29<1:42:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10017/15526 [3:05:29<1:42:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10018/15526 [3:05:30<1:41:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10018/15526 [3:05:30<1:41:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10019/15526 [3:05:30<1:41:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10019/15526 [3:05:30<1:41:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10020/15526 [3:05:31<1:41:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10020/15526 [3:05:31<1:41:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10021/15526 [3:05:32<1:41:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10021/15526 [3:05:32<1:41:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10022/15526 [3:05:33<1:41:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10022/15526 [3:05:33<1:41:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10023/15526 [3:05:34<1:41:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10023/15526 [3:05:34<1:41:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10024/15526 [3:05:35<1:41:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10024/15526 [3:05:35<1:41:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10025/15526 [3:05:35<1:41:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10025/15526 [3:05:35<1:41:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10026/15526 [3:05:36<1:41:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10026/15526 [3:05:36<1:41:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10027/15526 [3:05:38<1:41:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10027/15526 [3:05:38<1:41:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10028/15526 [3:05:38<1:41:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10028/15526 [3:05:38<1:41:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10029/15526 [3:05:40<1:41:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10029/15526 [3:05:40<1:41:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10030/15526 [3:05:41<1:41:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10030/15526 [3:05:41<1:41:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10031/15526 [3:05:41<1:41:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10031/15526 [3:05:41<1:41:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10032/15526 [3:05:42<1:41:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10032/15526 [3:05:42<1:41:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10033/15526 [3:05:43<1:41:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10033/15526 [3:05:43<1:41:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10034/15526 [3:05:44<1:41:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10034/15526 [3:05:44<1:41:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10035/15526 [3:05:45<1:41:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10035/15526 [3:05:45<1:41:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10036/15526 [3:05:45<1:41:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10036/15526 [3:05:45<1:41:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10037/15526 [3:05:46<1:41:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10037/15526 [3:05:46<1:41:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10038/15526 [3:05:47<1:41:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10038/15526 [3:05:47<1:41:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10039/15526 [3:05:47<1:41:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10039/15526 [3:05:47<1:41:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10040/15526 [3:05:48<1:41:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10040/15526 [3:05:48<1:41:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10041/15526 [3:05:49<1:41:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10041/15526 [3:05:49<1:41:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10042/15526 [3:05:50<1:41:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10042/15526 [3:05:50<1:41:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10043/15526 [3:05:51<1:41:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10043/15526 [3:05:51<1:41:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10044/15526 [3:05:51<1:41:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10044/15526 [3:05:51<1:41:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10045/15526 [3:05:52<1:41:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10045/15526 [3:05:52<1:41:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10046/15526 [3:05:53<1:41:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10046/15526 [3:05:53<1:41:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10047/15526 [3:05:53<1:41:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10047/15526 [3:05:53<1:41:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10048/15526 [3:06:02<1:41:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10048/15526 [3:06:02<1:41:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10049/15526 [3:06:04<1:41:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10049/15526 [3:06:04<1:41:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10050/15526 [3:06:04<1:41:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10050/15526 [3:06:04<1:41:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10051/15526 [3:06:05<1:41:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10051/15526 [3:06:05<1:41:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10052/15526 [3:06:07<1:41:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10052/15526 [3:06:07<1:41:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10053/15526 [3:06:07<1:41:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10053/15526 [3:06:07<1:41:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10054/15526 [3:06:08<1:41:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10054/15526 [3:06:08<1:41:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10055/15526 [3:06:09<1:41:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10055/15526 [3:06:09<1:41:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10056/15526 [3:06:10<1:41:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10056/15526 [3:06:10<1:41:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10057/15526 [3:06:11<1:41:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10057/15526 [3:06:11<1:41:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10058/15526 [3:06:12<1:41:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10058/15526 [3:06:12<1:41:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10059/15526 [3:06:12<1:41:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10059/15526 [3:06:12<1:41:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10060/15526 [3:06:13<1:41:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10060/15526 [3:06:13<1:41:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10061/15526 [3:06:14<1:41:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10061/15526 [3:06:14<1:41:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10062/15526 [3:06:15<1:41:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10062/15526 [3:06:15<1:41:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10063/15526 [3:06:16<1:41:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10063/15526 [3:06:16<1:41:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10064/15526 [3:06:17<1:41:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10064/15526 [3:06:17<1:41:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10065/15526 [3:06:18<1:41:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10065/15526 [3:06:18<1:41:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10066/15526 [3:06:18<1:41:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10066/15526 [3:06:18<1:41:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10067/15526 [3:06:19<1:41:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10067/15526 [3:06:19<1:41:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10068/15526 [3:06:20<1:41:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10068/15526 [3:06:20<1:41:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10069/15526 [3:06:22<1:41:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10069/15526 [3:06:22<1:41:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10070/15526 [3:06:23<1:40:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10070/15526 [3:06:23<1:40:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10071/15526 [3:06:23<1:40:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10071/15526 [3:06:23<1:40:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10072/15526 [3:06:25<1:40:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10072/15526 [3:06:25<1:40:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10073/15526 [3:06:26<1:40:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10073/15526 [3:06:26<1:40:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10074/15526 [3:06:26<1:40:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10074/15526 [3:06:26<1:40:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10075/15526 [3:06:27<1:40:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10075/15526 [3:06:27<1:40:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10076/15526 [3:06:28<1:40:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10076/15526 [3:06:28<1:40:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10077/15526 [3:06:29<1:40:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10077/15526 [3:06:29<1:40:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10078/15526 [3:06:31<1:40:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10078/15526 [3:06:31<1:40:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10079/15526 [3:06:31<1:40:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10079/15526 [3:06:31<1:40:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10080/15526 [3:06:38<1:40:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10080/15526 [3:06:38<1:40:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10081/15526 [3:06:39<1:40:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10081/15526 [3:06:39<1:40:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10082/15526 [3:06:40<1:40:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10082/15526 [3:06:40<1:40:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10083/15526 [3:06:40<1:40:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10083/15526 [3:06:40<1:40:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10084/15526 [3:06:41<1:40:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10084/15526 [3:06:41<1:40:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10085/15526 [3:06:42<1:40:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10085/15526 [3:06:42<1:40:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10086/15526 [3:06:43<1:40:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10086/15526 [3:06:43<1:40:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10087/15526 [3:06:43<1:40:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10087/15526 [3:06:43<1:40:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10088/15526 [3:06:45<1:40:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10088/15526 [3:06:45<1:40:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10089/15526 [3:06:45<1:40:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10089/15526 [3:06:45<1:40:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10090/15526 [3:06:46<1:40:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10090/15526 [3:06:46<1:40:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10091/15526 [3:06:48<1:40:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10091/15526 [3:06:48<1:40:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10092/15526 [3:06:49<1:40:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10092/15526 [3:06:49<1:40:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10093/15526 [3:06:50<1:40:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10093/15526 [3:06:50<1:40:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10094/15526 [3:06:50<1:40:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10094/15526 [3:06:50<1:40:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10095/15526 [3:06:51<1:40:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10095/15526 [3:06:51<1:40:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10096/15526 [3:06:52<1:40:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10096/15526 [3:06:52<1:40:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10097/15526 [3:06:53<1:40:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10097/15526 [3:06:53<1:40:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10098/15526 [3:06:53<1:40:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10098/15526 [3:06:53<1:40:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10099/15526 [3:06:54<1:40:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10099/15526 [3:06:54<1:40:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10100/15526 [3:06:55<1:40:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10100/15526 [3:06:55<1:40:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10101/15526 [3:06:55<1:40:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10101/15526 [3:06:55<1:40:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10102/15526 [3:06:57<1:40:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10102/15526 [3:06:57<1:40:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10103/15526 [3:06:57<1:40:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10103/15526 [3:06:57<1:40:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10104/15526 [3:06:59<1:40:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10104/15526 [3:06:59<1:40:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10105/15526 [3:06:59<1:40:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10105/15526 [3:06:59<1:40:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10106/15526 [3:07:00<1:40:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10106/15526 [3:07:00<1:40:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10107/15526 [3:07:02<1:40:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10107/15526 [3:07:02<1:40:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10108/15526 [3:07:02<1:40:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10108/15526 [3:07:02<1:40:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10109/15526 [3:07:03<1:40:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10109/15526 [3:07:03<1:40:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10110/15526 [3:07:04<1:40:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10110/15526 [3:07:04<1:40:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10111/15526 [3:07:05<1:40:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10111/15526 [3:07:05<1:40:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10112/15526 [3:07:11<1:40:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10112/15526 [3:07:11<1:40:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10113/15526 [3:07:12<1:40:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10113/15526 [3:07:12<1:40:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10114/15526 [3:07:13<1:40:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10114/15526 [3:07:13<1:40:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10115/15526 [3:07:14<1:40:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10115/15526 [3:07:14<1:40:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10116/15526 [3:07:15<1:40:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10116/15526 [3:07:15<1:40:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10117/15526 [3:07:16<1:40:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10117/15526 [3:07:16<1:40:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10118/15526 [3:07:17<1:40:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10118/15526 [3:07:17<1:40:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10119/15526 [3:07:18<1:40:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10119/15526 [3:07:18<1:40:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10120/15526 [3:07:19<1:40:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10120/15526 [3:07:19<1:40:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10121/15526 [3:07:20<1:40:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10121/15526 [3:07:20<1:40:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10122/15526 [3:07:21<1:40:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10122/15526 [3:07:21<1:40:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10123/15526 [3:07:22<1:40:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10123/15526 [3:07:22<1:40:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10124/15526 [3:07:22<1:39:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10124/15526 [3:07:22<1:39:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10125/15526 [3:07:23<1:39:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10125/15526 [3:07:23<1:39:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10126/15526 [3:07:24<1:39:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10126/15526 [3:07:24<1:39:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10127/15526 [3:07:25<1:39:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10127/15526 [3:07:25<1:39:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10128/15526 [3:07:26<1:39:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10128/15526 [3:07:26<1:39:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10129/15526 [3:07:26<1:39:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10129/15526 [3:07:26<1:39:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10130/15526 [3:07:27<1:39:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10130/15526 [3:07:27<1:39:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10131/15526 [3:07:28<1:39:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10131/15526 [3:07:28<1:39:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10132/15526 [3:07:29<1:39:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10132/15526 [3:07:29<1:39:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10133/15526 [3:07:29<1:39:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10133/15526 [3:07:29<1:39:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10134/15526 [3:07:30<1:39:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10134/15526 [3:07:30<1:39:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10135/15526 [3:07:31<1:39:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10135/15526 [3:07:31<1:39:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10136/15526 [3:07:32<1:39:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10136/15526 [3:07:32<1:39:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10137/15526 [3:07:33<1:39:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10137/15526 [3:07:33<1:39:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10138/15526 [3:07:34<1:39:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10138/15526 [3:07:34<1:39:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10139/15526 [3:07:35<1:39:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10139/15526 [3:07:35<1:39:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10140/15526 [3:07:36<1:39:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10140/15526 [3:07:36<1:39:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10141/15526 [3:07:37<1:39:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10141/15526 [3:07:37<1:39:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10142/15526 [3:07:37<1:39:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10142/15526 [3:07:37<1:39:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10143/15526 [3:07:39<1:39:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10143/15526 [3:07:39<1:39:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10144/15526 [3:07:46<1:39:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10144/15526 [3:07:46<1:39:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10145/15526 [3:07:46<1:39:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10145/15526 [3:07:46<1:39:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10146/15526 [3:07:47<1:39:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10146/15526 [3:07:47<1:39:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10147/15526 [3:07:48<1:39:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10147/15526 [3:07:48<1:39:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10148/15526 [3:07:48<1:39:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10148/15526 [3:07:48<1:39:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10149/15526 [3:07:49<1:39:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10149/15526 [3:07:49<1:39:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10150/15526 [3:07:50<1:39:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10150/15526 [3:07:50<1:39:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10151/15526 [3:07:51<1:39:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10151/15526 [3:07:51<1:39:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10152/15526 [3:07:52<1:39:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10152/15526 [3:07:52<1:39:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10153/15526 [3:07:53<1:39:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10153/15526 [3:07:53<1:39:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10154/15526 [3:07:54<1:39:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10154/15526 [3:07:54<1:39:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10155/15526 [3:07:55<1:39:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10155/15526 [3:07:55<1:39:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10156/15526 [3:07:55<1:39:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10156/15526 [3:07:55<1:39:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10157/15526 [3:07:56<1:39:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10157/15526 [3:07:56<1:39:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10158/15526 [3:07:57<1:39:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10158/15526 [3:07:57<1:39:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10159/15526 [3:07:58<1:39:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10159/15526 [3:07:58<1:39:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10160/15526 [3:07:59<1:39:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10160/15526 [3:07:59<1:39:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10161/15526 [3:08:00<1:39:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10161/15526 [3:08:00<1:39:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10162/15526 [3:08:01<1:39:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10162/15526 [3:08:01<1:39:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10163/15526 [3:08:02<1:39:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10163/15526 [3:08:02<1:39:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10164/15526 [3:08:02<1:39:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10164/15526 [3:08:02<1:39:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10165/15526 [3:08:03<1:39:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10165/15526 [3:08:03<1:39:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10166/15526 [3:08:04<1:39:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10166/15526 [3:08:04<1:39:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10167/15526 [3:08:05<1:39:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10167/15526 [3:08:05<1:39:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10168/15526 [3:08:06<1:39:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10168/15526 [3:08:06<1:39:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 10169/15526 [3:08:07<1:39:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  65%|▋| 10169/15526 [3:08:07<1:39:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10170/15526 [3:08:09<1:39:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10170/15526 [3:08:09<1:39:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10171/15526 [3:08:10<1:39:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10171/15526 [3:08:10<1:39:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10172/15526 [3:08:11<1:39:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10172/15526 [3:08:11<1:39:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10173/15526 [3:08:12<1:39:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10173/15526 [3:08:12<1:39:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10174/15526 [3:08:13<1:39:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10174/15526 [3:08:13<1:39:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10175/15526 [3:08:13<1:38:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10175/15526 [3:08:13<1:38:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10176/15526 [3:08:22<1:39:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10176/15526 [3:08:22<1:39:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10177/15526 [3:08:23<1:39:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10177/15526 [3:08:23<1:39:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10178/15526 [3:08:24<1:38:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10178/15526 [3:08:24<1:38:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10179/15526 [3:08:25<1:38:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10179/15526 [3:08:25<1:38:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10180/15526 [3:08:27<1:38:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10180/15526 [3:08:27<1:38:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10181/15526 [3:08:27<1:38:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10181/15526 [3:08:27<1:38:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10182/15526 [3:08:28<1:38:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10182/15526 [3:08:28<1:38:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10183/15526 [3:08:29<1:38:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10183/15526 [3:08:29<1:38:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10184/15526 [3:08:30<1:38:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10184/15526 [3:08:30<1:38:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10185/15526 [3:08:31<1:38:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10185/15526 [3:08:31<1:38:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10186/15526 [3:08:32<1:38:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10186/15526 [3:08:32<1:38:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10187/15526 [3:08:32<1:38:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10187/15526 [3:08:32<1:38:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10188/15526 [3:08:33<1:38:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10188/15526 [3:08:33<1:38:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10189/15526 [3:08:34<1:38:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10189/15526 [3:08:34<1:38:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10190/15526 [3:08:35<1:38:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10190/15526 [3:08:35<1:38:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10191/15526 [3:08:36<1:38:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10191/15526 [3:08:36<1:38:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10192/15526 [3:08:37<1:38:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10192/15526 [3:08:37<1:38:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10193/15526 [3:08:38<1:38:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10193/15526 [3:08:38<1:38:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10194/15526 [3:08:39<1:38:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10194/15526 [3:08:39<1:38:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10195/15526 [3:08:40<1:38:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10195/15526 [3:08:40<1:38:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10196/15526 [3:08:41<1:38:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10196/15526 [3:08:41<1:38:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10197/15526 [3:08:42<1:38:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10197/15526 [3:08:42<1:38:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10198/15526 [3:08:43<1:38:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10198/15526 [3:08:43<1:38:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10199/15526 [3:08:44<1:38:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10199/15526 [3:08:44<1:38:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10200/15526 [3:08:45<1:38:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10200/15526 [3:08:45<1:38:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10201/15526 [3:08:46<1:38:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10201/15526 [3:08:46<1:38:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10202/15526 [3:08:47<1:38:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10202/15526 [3:08:47<1:38:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10203/15526 [3:08:48<1:38:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10203/15526 [3:08:48<1:38:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10204/15526 [3:08:49<1:38:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10204/15526 [3:08:49<1:38:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10205/15526 [3:08:50<1:38:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10205/15526 [3:08:50<1:38:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10206/15526 [3:08:50<1:38:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10206/15526 [3:08:50<1:38:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10207/15526 [3:08:51<1:38:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10207/15526 [3:08:51<1:38:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10208/15526 [3:08:57<1:38:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10208/15526 [3:08:57<1:38:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10209/15526 [3:08:58<1:38:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10209/15526 [3:08:58<1:38:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10210/15526 [3:08:59<1:38:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10210/15526 [3:08:59<1:38:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10211/15526 [3:09:00<1:38:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10211/15526 [3:09:00<1:38:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10212/15526 [3:09:01<1:38:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10212/15526 [3:09:01<1:38:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10213/15526 [3:09:02<1:38:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10213/15526 [3:09:02<1:38:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10214/15526 [3:09:03<1:38:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10214/15526 [3:09:03<1:38:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10215/15526 [3:09:03<1:38:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10215/15526 [3:09:03<1:38:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10216/15526 [3:09:04<1:38:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10216/15526 [3:09:04<1:38:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10217/15526 [3:09:06<1:38:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10217/15526 [3:09:06<1:38:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10218/15526 [3:09:06<1:38:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10218/15526 [3:09:06<1:38:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10219/15526 [3:09:07<1:38:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10219/15526 [3:09:07<1:38:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10220/15526 [3:09:08<1:38:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10220/15526 [3:09:08<1:38:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10221/15526 [3:09:09<1:38:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10221/15526 [3:09:09<1:38:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10222/15526 [3:09:10<1:38:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10222/15526 [3:09:10<1:38:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10223/15526 [3:09:11<1:38:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10223/15526 [3:09:11<1:38:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10224/15526 [3:09:12<1:38:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10224/15526 [3:09:12<1:38:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10225/15526 [3:09:13<1:38:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10225/15526 [3:09:13<1:38:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10226/15526 [3:09:14<1:38:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10226/15526 [3:09:14<1:38:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10227/15526 [3:09:15<1:38:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10227/15526 [3:09:15<1:38:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10228/15526 [3:09:16<1:38:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10228/15526 [3:09:16<1:38:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10229/15526 [3:09:17<1:38:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10229/15526 [3:09:17<1:38:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10230/15526 [3:09:18<1:38:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10230/15526 [3:09:18<1:38:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10231/15526 [3:09:19<1:37:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10231/15526 [3:09:19<1:37:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10232/15526 [3:09:20<1:37:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10232/15526 [3:09:20<1:37:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10233/15526 [3:09:21<1:37:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10233/15526 [3:09:21<1:37:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10234/15526 [3:09:21<1:37:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10234/15526 [3:09:21<1:37:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10235/15526 [3:09:23<1:37:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10235/15526 [3:09:23<1:37:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10236/15526 [3:09:24<1:37:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10236/15526 [3:09:24<1:37:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10237/15526 [3:09:24<1:37:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10237/15526 [3:09:24<1:37:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10238/15526 [3:09:25<1:37:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10238/15526 [3:09:25<1:37:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10239/15526 [3:09:26<1:37:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10239/15526 [3:09:26<1:37:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10240/15526 [3:09:32<1:37:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10240/15526 [3:09:32<1:37:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10241/15526 [3:09:33<1:37:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10241/15526 [3:09:33<1:37:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10242/15526 [3:09:34<1:37:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10242/15526 [3:09:34<1:37:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10243/15526 [3:09:35<1:37:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10243/15526 [3:09:35<1:37:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10244/15526 [3:09:35<1:37:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10244/15526 [3:09:35<1:37:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10245/15526 [3:09:37<1:37:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10245/15526 [3:09:37<1:37:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10246/15526 [3:09:37<1:37:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10246/15526 [3:09:37<1:37:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10247/15526 [3:09:38<1:37:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10247/15526 [3:09:38<1:37:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10248/15526 [3:09:39<1:37:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10248/15526 [3:09:39<1:37:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10249/15526 [3:09:39<1:37:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10249/15526 [3:09:39<1:37:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10250/15526 [3:09:40<1:37:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10250/15526 [3:09:40<1:37:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10251/15526 [3:09:41<1:37:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10251/15526 [3:09:41<1:37:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10252/15526 [3:09:41<1:37:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10252/15526 [3:09:41<1:37:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10253/15526 [3:09:42<1:37:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10253/15526 [3:09:42<1:37:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10254/15526 [3:09:43<1:37:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10254/15526 [3:09:43<1:37:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10255/15526 [3:09:43<1:37:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10255/15526 [3:09:43<1:37:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10256/15526 [3:09:44<1:37:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10256/15526 [3:09:44<1:37:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10257/15526 [3:09:45<1:37:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10257/15526 [3:09:45<1:37:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10258/15526 [3:09:45<1:37:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10258/15526 [3:09:45<1:37:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10259/15526 [3:09:46<1:37:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10259/15526 [3:09:46<1:37:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10260/15526 [3:09:47<1:37:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10260/15526 [3:09:47<1:37:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10261/15526 [3:09:48<1:37:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10261/15526 [3:09:48<1:37:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10262/15526 [3:09:49<1:37:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10262/15526 [3:09:49<1:37:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10263/15526 [3:09:50<1:37:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10263/15526 [3:09:50<1:37:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10264/15526 [3:09:51<1:37:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10264/15526 [3:09:51<1:37:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10265/15526 [3:09:53<1:37:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10265/15526 [3:09:53<1:37:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10266/15526 [3:09:54<1:37:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10266/15526 [3:09:54<1:37:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10267/15526 [3:09:55<1:37:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10267/15526 [3:09:55<1:37:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10268/15526 [3:09:55<1:37:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10268/15526 [3:09:55<1:37:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10269/15526 [3:09:57<1:37:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10269/15526 [3:09:57<1:37:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10270/15526 [3:09:57<1:37:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10270/15526 [3:09:57<1:37:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10271/15526 [3:09:58<1:37:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10271/15526 [3:09:58<1:37:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10272/15526 [3:10:05<1:37:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10272/15526 [3:10:05<1:37:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10273/15526 [3:10:06<1:37:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10273/15526 [3:10:06<1:37:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10274/15526 [3:10:07<1:37:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10274/15526 [3:10:07<1:37:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10275/15526 [3:10:08<1:37:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10275/15526 [3:10:08<1:37:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10276/15526 [3:10:09<1:37:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10276/15526 [3:10:09<1:37:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10277/15526 [3:10:10<1:37:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10277/15526 [3:10:10<1:37:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10278/15526 [3:10:11<1:37:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10278/15526 [3:10:11<1:37:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10279/15526 [3:10:12<1:37:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10279/15526 [3:10:12<1:37:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10280/15526 [3:10:13<1:37:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10280/15526 [3:10:13<1:37:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10281/15526 [3:10:14<1:37:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10281/15526 [3:10:14<1:37:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10282/15526 [3:10:15<1:37:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10282/15526 [3:10:15<1:37:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10283/15526 [3:10:16<1:37:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10283/15526 [3:10:16<1:37:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10284/15526 [3:10:17<1:36:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10284/15526 [3:10:17<1:36:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10285/15526 [3:10:18<1:36:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10285/15526 [3:10:18<1:36:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10286/15526 [3:10:19<1:36:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10286/15526 [3:10:19<1:36:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10287/15526 [3:10:20<1:36:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10287/15526 [3:10:20<1:36:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10288/15526 [3:10:20<1:36:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10288/15526 [3:10:20<1:36:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10289/15526 [3:10:21<1:36:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10289/15526 [3:10:21<1:36:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10290/15526 [3:10:22<1:36:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10290/15526 [3:10:22<1:36:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10291/15526 [3:10:23<1:36:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10291/15526 [3:10:23<1:36:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10292/15526 [3:10:24<1:36:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10292/15526 [3:10:24<1:36:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10293/15526 [3:10:24<1:36:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10293/15526 [3:10:24<1:36:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10294/15526 [3:10:25<1:36:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10294/15526 [3:10:25<1:36:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10295/15526 [3:10:26<1:36:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10295/15526 [3:10:26<1:36:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10296/15526 [3:10:26<1:36:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10296/15526 [3:10:26<1:36:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10297/15526 [3:10:27<1:36:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10297/15526 [3:10:27<1:36:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10298/15526 [3:10:28<1:36:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10298/15526 [3:10:28<1:36:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10299/15526 [3:10:28<1:36:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10299/15526 [3:10:28<1:36:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10300/15526 [3:10:29<1:36:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10300/15526 [3:10:29<1:36:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10301/15526 [3:10:30<1:36:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10301/15526 [3:10:30<1:36:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10302/15526 [3:10:31<1:36:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10302/15526 [3:10:31<1:36:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10303/15526 [3:10:32<1:36:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10303/15526 [3:10:32<1:36:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10304/15526 [3:10:41<1:36:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10304/15526 [3:10:41<1:36:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10305/15526 [3:10:41<1:36:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10305/15526 [3:10:41<1:36:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10306/15526 [3:10:42<1:36:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10306/15526 [3:10:42<1:36:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10307/15526 [3:10:43<1:36:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10307/15526 [3:10:43<1:36:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10308/15526 [3:10:44<1:36:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10308/15526 [3:10:44<1:36:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10309/15526 [3:10:44<1:36:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10309/15526 [3:10:44<1:36:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10310/15526 [3:10:45<1:36:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10310/15526 [3:10:45<1:36:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10311/15526 [3:10:46<1:36:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10311/15526 [3:10:46<1:36:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10312/15526 [3:10:47<1:36:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10312/15526 [3:10:47<1:36:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10313/15526 [3:10:48<1:36:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10313/15526 [3:10:48<1:36:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10314/15526 [3:10:48<1:36:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10314/15526 [3:10:48<1:36:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10315/15526 [3:10:49<1:36:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10315/15526 [3:10:49<1:36:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10316/15526 [3:10:50<1:36:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10316/15526 [3:10:50<1:36:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10317/15526 [3:10:51<1:36:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10317/15526 [3:10:51<1:36:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10318/15526 [3:10:52<1:36:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10318/15526 [3:10:52<1:36:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10319/15526 [3:10:52<1:36:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10319/15526 [3:10:52<1:36:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10320/15526 [3:10:53<1:36:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10320/15526 [3:10:53<1:36:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10321/15526 [3:10:55<1:36:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10321/15526 [3:10:55<1:36:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10322/15526 [3:10:56<1:36:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10322/15526 [3:10:56<1:36:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10323/15526 [3:10:57<1:36:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10323/15526 [3:10:57<1:36:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 10324/15526 [3:10:57<1:36:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  66%|▋| 10324/15526 [3:10:57<1:36:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10325/15526 [3:10:58<1:36:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10325/15526 [3:10:58<1:36:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10326/15526 [3:10:59<1:36:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10326/15526 [3:10:59<1:36:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10327/15526 [3:10:59<1:36:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10327/15526 [3:10:59<1:36:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10328/15526 [3:11:01<1:36:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10328/15526 [3:11:01<1:36:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10329/15526 [3:11:01<1:36:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10329/15526 [3:11:01<1:36:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10330/15526 [3:11:02<1:36:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10330/15526 [3:11:02<1:36:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10331/15526 [3:11:03<1:36:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10331/15526 [3:11:03<1:36:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10332/15526 [3:11:04<1:36:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10332/15526 [3:11:04<1:36:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10333/15526 [3:11:05<1:36:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10333/15526 [3:11:05<1:36:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10334/15526 [3:11:05<1:36:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10334/15526 [3:11:05<1:36:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10335/15526 [3:11:06<1:35:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10335/15526 [3:11:06<1:35:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10336/15526 [3:11:14<1:36:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10336/15526 [3:11:14<1:36:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10337/15526 [3:11:15<1:36:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10337/15526 [3:11:15<1:36:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10338/15526 [3:11:16<1:35:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10338/15526 [3:11:16<1:35:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10339/15526 [3:11:16<1:35:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10339/15526 [3:11:16<1:35:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10340/15526 [3:11:17<1:35:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10340/15526 [3:11:17<1:35:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10341/15526 [3:11:18<1:35:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10341/15526 [3:11:18<1:35:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10342/15526 [3:11:19<1:35:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10342/15526 [3:11:19<1:35:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10343/15526 [3:11:19<1:35:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10343/15526 [3:11:19<1:35:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10344/15526 [3:11:20<1:35:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10344/15526 [3:11:20<1:35:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10345/15526 [3:11:22<1:35:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10345/15526 [3:11:22<1:35:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10346/15526 [3:11:22<1:35:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10346/15526 [3:11:22<1:35:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10347/15526 [3:11:23<1:35:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10347/15526 [3:11:23<1:35:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10348/15526 [3:11:24<1:35:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10348/15526 [3:11:24<1:35:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10349/15526 [3:11:24<1:35:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10349/15526 [3:11:24<1:35:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10350/15526 [3:11:26<1:35:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10350/15526 [3:11:26<1:35:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10351/15526 [3:11:26<1:35:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10351/15526 [3:11:26<1:35:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10352/15526 [3:11:27<1:35:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10352/15526 [3:11:27<1:35:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10353/15526 [3:11:28<1:35:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10353/15526 [3:11:28<1:35:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10354/15526 [3:11:28<1:35:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10354/15526 [3:11:28<1:35:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10355/15526 [3:11:29<1:35:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10355/15526 [3:11:29<1:35:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10356/15526 [3:11:30<1:35:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10356/15526 [3:11:30<1:35:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10357/15526 [3:11:31<1:35:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10357/15526 [3:11:31<1:35:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10358/15526 [3:11:32<1:35:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10358/15526 [3:11:32<1:35:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10359/15526 [3:11:33<1:35:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10359/15526 [3:11:33<1:35:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10360/15526 [3:11:34<1:35:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10360/15526 [3:11:34<1:35:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10361/15526 [3:11:34<1:35:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10361/15526 [3:11:34<1:35:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10362/15526 [3:11:35<1:35:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10362/15526 [3:11:35<1:35:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10363/15526 [3:11:37<1:35:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10363/15526 [3:11:37<1:35:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10364/15526 [3:11:38<1:35:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10364/15526 [3:11:38<1:35:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10365/15526 [3:11:39<1:35:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10365/15526 [3:11:39<1:35:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10366/15526 [3:11:40<1:35:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10366/15526 [3:11:40<1:35:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10367/15526 [3:11:40<1:35:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10367/15526 [3:11:40<1:35:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10368/15526 [3:11:50<1:35:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10368/15526 [3:11:50<1:35:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10369/15526 [3:11:51<1:35:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10369/15526 [3:11:51<1:35:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10370/15526 [3:11:51<1:35:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10370/15526 [3:11:51<1:35:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10371/15526 [3:11:52<1:35:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10371/15526 [3:11:52<1:35:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10372/15526 [3:11:53<1:35:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10372/15526 [3:11:53<1:35:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10373/15526 [3:11:54<1:35:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10373/15526 [3:11:54<1:35:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10374/15526 [3:11:55<1:35:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10374/15526 [3:11:55<1:35:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10375/15526 [3:11:56<1:35:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10375/15526 [3:11:56<1:35:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10376/15526 [3:11:57<1:35:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10376/15526 [3:11:57<1:35:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10377/15526 [3:11:58<1:35:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10377/15526 [3:11:58<1:35:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10378/15526 [3:11:59<1:35:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10378/15526 [3:11:59<1:35:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10379/15526 [3:12:00<1:35:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10379/15526 [3:12:00<1:35:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10380/15526 [3:12:01<1:35:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10380/15526 [3:12:01<1:35:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10381/15526 [3:12:01<1:35:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10381/15526 [3:12:01<1:35:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10382/15526 [3:12:02<1:35:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10382/15526 [3:12:02<1:35:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10383/15526 [3:12:03<1:35:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10383/15526 [3:12:03<1:35:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10384/15526 [3:12:04<1:35:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10384/15526 [3:12:04<1:35:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10385/15526 [3:12:05<1:35:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10385/15526 [3:12:05<1:35:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10386/15526 [3:12:06<1:35:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10386/15526 [3:12:06<1:35:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10387/15526 [3:12:07<1:35:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10387/15526 [3:12:07<1:35:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10388/15526 [3:12:08<1:35:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10388/15526 [3:12:08<1:35:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10389/15526 [3:12:09<1:35:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10389/15526 [3:12:09<1:35:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10390/15526 [3:12:10<1:34:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10390/15526 [3:12:10<1:34:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10391/15526 [3:12:11<1:34:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10391/15526 [3:12:11<1:34:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10392/15526 [3:12:12<1:34:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10392/15526 [3:12:12<1:34:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10393/15526 [3:12:13<1:34:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10393/15526 [3:12:13<1:34:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10394/15526 [3:12:13<1:34:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10394/15526 [3:12:13<1:34:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10395/15526 [3:12:15<1:34:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10395/15526 [3:12:15<1:34:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10396/15526 [3:12:16<1:34:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10396/15526 [3:12:16<1:34:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10397/15526 [3:12:17<1:34:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10397/15526 [3:12:17<1:34:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10398/15526 [3:12:17<1:34:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10398/15526 [3:12:17<1:34:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10399/15526 [3:12:19<1:34:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10399/15526 [3:12:19<1:34:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10400/15526 [3:12:24<1:34:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10400/15526 [3:12:24<1:34:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10401/15526 [3:12:49<1:35:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10401/15526 [3:12:49<1:35:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10402/15526 [3:12:50<1:34:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10402/15526 [3:12:50<1:34:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10403/15526 [3:12:51<1:34:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10403/15526 [3:12:51<1:34:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10404/15526 [3:12:52<1:34:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10404/15526 [3:12:52<1:34:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10405/15526 [3:12:53<1:34:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10405/15526 [3:12:53<1:34:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10406/15526 [3:12:53<1:34:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10406/15526 [3:12:53<1:34:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10407/15526 [3:12:54<1:34:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10407/15526 [3:12:54<1:34:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10408/15526 [3:12:55<1:34:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10408/15526 [3:12:55<1:34:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10409/15526 [3:12:57<1:34:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10409/15526 [3:12:57<1:34:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10410/15526 [3:12:57<1:34:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10410/15526 [3:12:57<1:34:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10411/15526 [3:12:58<1:34:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10411/15526 [3:12:58<1:34:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10412/15526 [3:12:59<1:34:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10412/15526 [3:12:59<1:34:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10413/15526 [3:13:00<1:34:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10413/15526 [3:13:00<1:34:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10414/15526 [3:13:01<1:34:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10414/15526 [3:13:01<1:34:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10415/15526 [3:13:02<1:34:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10415/15526 [3:13:02<1:34:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10416/15526 [3:13:02<1:34:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10416/15526 [3:13:02<1:34:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10417/15526 [3:13:03<1:34:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10417/15526 [3:13:03<1:34:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10418/15526 [3:13:04<1:34:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10418/15526 [3:13:04<1:34:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10419/15526 [3:13:05<1:34:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10419/15526 [3:13:05<1:34:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10420/15526 [3:13:05<1:34:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10420/15526 [3:13:05<1:34:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10421/15526 [3:13:06<1:34:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10421/15526 [3:13:06<1:34:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10422/15526 [3:13:07<1:34:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10422/15526 [3:13:07<1:34:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10423/15526 [3:13:08<1:34:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10423/15526 [3:13:08<1:34:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10424/15526 [3:13:08<1:34:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10424/15526 [3:13:08<1:34:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10425/15526 [3:13:10<1:34:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10425/15526 [3:13:10<1:34:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10426/15526 [3:13:11<1:34:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10426/15526 [3:13:11<1:34:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10427/15526 [3:13:12<1:34:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10427/15526 [3:13:12<1:34:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10428/15526 [3:13:13<1:34:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10428/15526 [3:13:13<1:34:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10429/15526 [3:13:13<1:34:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10429/15526 [3:13:13<1:34:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10430/15526 [3:13:14<1:34:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10430/15526 [3:13:14<1:34:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10431/15526 [3:13:15<1:34:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10431/15526 [3:13:15<1:34:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10432/15526 [3:13:23<1:34:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10432/15526 [3:13:23<1:34:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10433/15526 [3:13:23<1:34:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10433/15526 [3:13:23<1:34:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10434/15526 [3:13:25<1:34:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10434/15526 [3:13:25<1:34:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10435/15526 [3:13:26<1:34:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10435/15526 [3:13:26<1:34:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10436/15526 [3:13:26<1:34:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10436/15526 [3:13:26<1:34:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10437/15526 [3:13:27<1:34:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10437/15526 [3:13:27<1:34:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10438/15526 [3:13:28<1:34:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10438/15526 [3:13:28<1:34:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10439/15526 [3:13:28<1:34:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10439/15526 [3:13:28<1:34:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10440/15526 [3:13:29<1:34:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10440/15526 [3:13:29<1:34:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10441/15526 [3:13:30<1:34:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10441/15526 [3:13:30<1:34:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10442/15526 [3:13:30<1:34:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10442/15526 [3:13:30<1:34:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10443/15526 [3:13:32<1:34:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10443/15526 [3:13:32<1:34:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10444/15526 [3:13:33<1:34:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10444/15526 [3:13:33<1:34:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10445/15526 [3:13:33<1:34:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10445/15526 [3:13:33<1:34:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10446/15526 [3:13:35<1:34:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10446/15526 [3:13:35<1:34:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10447/15526 [3:13:36<1:34:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10447/15526 [3:13:36<1:34:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10448/15526 [3:13:36<1:34:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10448/15526 [3:13:36<1:34:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10449/15526 [3:13:37<1:34:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10449/15526 [3:13:37<1:34:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10450/15526 [3:13:38<1:34:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10450/15526 [3:13:38<1:34:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10451/15526 [3:13:38<1:34:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10451/15526 [3:13:38<1:34:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10452/15526 [3:13:39<1:34:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10452/15526 [3:13:39<1:34:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10453/15526 [3:13:40<1:33:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10453/15526 [3:13:40<1:33:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10454/15526 [3:13:41<1:33:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10454/15526 [3:13:41<1:33:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10455/15526 [3:13:42<1:33:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10455/15526 [3:13:42<1:33:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10456/15526 [3:13:43<1:33:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10456/15526 [3:13:43<1:33:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10457/15526 [3:13:44<1:33:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10457/15526 [3:13:44<1:33:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10458/15526 [3:13:45<1:33:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10458/15526 [3:13:45<1:33:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10459/15526 [3:13:45<1:33:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10459/15526 [3:13:45<1:33:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10460/15526 [3:13:46<1:33:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10460/15526 [3:13:46<1:33:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10461/15526 [3:13:47<1:33:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10461/15526 [3:13:47<1:33:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10462/15526 [3:13:48<1:33:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10462/15526 [3:13:48<1:33:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10463/15526 [3:13:48<1:33:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10463/15526 [3:13:48<1:33:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10464/15526 [3:13:56<1:33:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10464/15526 [3:13:56<1:33:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10465/15526 [3:13:57<1:33:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10465/15526 [3:13:57<1:33:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10466/15526 [3:13:58<1:33:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10466/15526 [3:13:58<1:33:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10467/15526 [3:13:59<1:33:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10467/15526 [3:13:59<1:33:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10468/15526 [3:13:59<1:33:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10468/15526 [3:13:59<1:33:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10469/15526 [3:14:01<1:33:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10469/15526 [3:14:01<1:33:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10470/15526 [3:14:02<1:33:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10470/15526 [3:14:02<1:33:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10471/15526 [3:14:03<1:33:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10471/15526 [3:14:03<1:33:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10472/15526 [3:14:04<1:33:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10472/15526 [3:14:04<1:33:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10473/15526 [3:14:04<1:33:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10473/15526 [3:14:04<1:33:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10474/15526 [3:14:05<1:33:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10474/15526 [3:14:05<1:33:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10475/15526 [3:14:06<1:33:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10475/15526 [3:14:06<1:33:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10476/15526 [3:14:07<1:33:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10476/15526 [3:14:07<1:33:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10477/15526 [3:14:08<1:33:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10477/15526 [3:14:08<1:33:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10478/15526 [3:14:09<1:33:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10478/15526 [3:14:09<1:33:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10479/15526 [3:14:10<1:33:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10479/15526 [3:14:10<1:33:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 10480/15526 [3:14:11<1:33:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  67%|▋| 10480/15526 [3:14:11<1:33:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10481/15526 [3:14:12<1:33:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10481/15526 [3:14:12<1:33:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10482/15526 [3:14:13<1:33:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10482/15526 [3:14:13<1:33:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10483/15526 [3:14:13<1:33:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10483/15526 [3:14:13<1:33:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10484/15526 [3:14:15<1:33:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10484/15526 [3:14:15<1:33:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10485/15526 [3:14:16<1:33:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10485/15526 [3:14:16<1:33:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10486/15526 [3:14:16<1:33:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10486/15526 [3:14:16<1:33:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10487/15526 [3:14:17<1:33:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10487/15526 [3:14:17<1:33:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10488/15526 [3:14:18<1:33:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10488/15526 [3:14:18<1:33:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10489/15526 [3:14:19<1:33:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10489/15526 [3:14:19<1:33:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10490/15526 [3:14:20<1:33:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10490/15526 [3:14:20<1:33:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10491/15526 [3:14:21<1:33:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10491/15526 [3:14:21<1:33:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10492/15526 [3:14:22<1:33:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10492/15526 [3:14:22<1:33:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10493/15526 [3:14:23<1:33:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10493/15526 [3:14:23<1:33:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10494/15526 [3:14:23<1:33:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10494/15526 [3:14:23<1:33:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10495/15526 [3:14:25<1:33:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10495/15526 [3:14:25<1:33:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10496/15526 [3:14:31<1:33:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10496/15526 [3:14:31<1:33:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10497/15526 [3:14:31<1:33:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10497/15526 [3:14:31<1:33:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10498/15526 [3:14:32<1:33:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10498/15526 [3:14:32<1:33:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10499/15526 [3:14:33<1:33:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10499/15526 [3:14:33<1:33:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10500/15526 [3:14:34<1:33:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10500/15526 [3:14:34<1:33:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10501/15526 [3:14:35<1:33:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10501/15526 [3:14:35<1:33:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10502/15526 [3:14:36<1:33:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10502/15526 [3:14:36<1:33:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10503/15526 [3:14:36<1:33:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10503/15526 [3:14:36<1:33:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10504/15526 [3:14:37<1:33:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10504/15526 [3:14:37<1:33:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10505/15526 [3:14:38<1:33:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10505/15526 [3:14:38<1:33:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10506/15526 [3:14:39<1:33:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10506/15526 [3:14:39<1:33:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10507/15526 [3:14:40<1:32:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10507/15526 [3:14:40<1:32:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10508/15526 [3:14:42<1:32:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10508/15526 [3:14:42<1:32:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10509/15526 [3:14:43<1:32:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10509/15526 [3:14:43<1:32:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10510/15526 [3:14:44<1:32:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10510/15526 [3:14:44<1:32:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10511/15526 [3:14:45<1:32:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10511/15526 [3:14:45<1:32:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10512/15526 [3:14:46<1:32:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10512/15526 [3:14:46<1:32:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10513/15526 [3:14:47<1:32:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10513/15526 [3:14:47<1:32:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10514/15526 [3:14:48<1:32:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10514/15526 [3:14:48<1:32:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10515/15526 [3:14:49<1:32:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10515/15526 [3:14:49<1:32:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10516/15526 [3:14:51<1:32:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10516/15526 [3:14:51<1:32:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10517/15526 [3:14:52<1:32:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10517/15526 [3:14:52<1:32:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10518/15526 [3:14:53<1:32:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10518/15526 [3:14:53<1:32:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10519/15526 [3:14:54<1:32:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10519/15526 [3:14:54<1:32:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10520/15526 [3:14:55<1:32:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10520/15526 [3:14:55<1:32:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10521/15526 [3:14:56<1:32:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10521/15526 [3:14:56<1:32:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10522/15526 [3:14:56<1:32:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10522/15526 [3:14:56<1:32:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10523/15526 [3:14:57<1:32:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10523/15526 [3:14:57<1:32:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10524/15526 [3:14:58<1:32:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10524/15526 [3:14:58<1:32:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10525/15526 [3:14:59<1:32:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10525/15526 [3:14:59<1:32:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10526/15526 [3:14:59<1:32:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10526/15526 [3:14:59<1:32:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10527/15526 [3:15:01<1:32:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10527/15526 [3:15:01<1:32:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10528/15526 [3:15:07<1:32:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10528/15526 [3:15:07<1:32:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10529/15526 [3:15:08<1:32:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10529/15526 [3:15:08<1:32:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10530/15526 [3:15:08<1:32:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10530/15526 [3:15:08<1:32:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10531/15526 [3:15:09<1:32:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10531/15526 [3:15:09<1:32:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10532/15526 [3:15:10<1:32:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10532/15526 [3:15:10<1:32:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10533/15526 [3:15:11<1:32:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10533/15526 [3:15:11<1:32:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10534/15526 [3:15:12<1:32:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10534/15526 [3:15:12<1:32:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10535/15526 [3:15:12<1:32:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10535/15526 [3:15:12<1:32:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10536/15526 [3:15:13<1:32:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10536/15526 [3:15:13<1:32:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10537/15526 [3:15:15<1:32:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10537/15526 [3:15:15<1:32:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10538/15526 [3:15:16<1:32:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10538/15526 [3:15:16<1:32:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10539/15526 [3:15:17<1:32:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10539/15526 [3:15:17<1:32:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10540/15526 [3:15:18<1:32:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10540/15526 [3:15:18<1:32:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10541/15526 [3:15:19<1:32:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10541/15526 [3:15:19<1:32:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10542/15526 [3:15:20<1:32:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10542/15526 [3:15:20<1:32:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10543/15526 [3:15:20<1:32:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10543/15526 [3:15:20<1:32:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10544/15526 [3:15:21<1:32:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10544/15526 [3:15:21<1:32:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10545/15526 [3:15:22<1:32:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10545/15526 [3:15:22<1:32:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10546/15526 [3:15:23<1:32:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10546/15526 [3:15:23<1:32:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10547/15526 [3:15:24<1:32:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10547/15526 [3:15:24<1:32:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10548/15526 [3:15:25<1:32:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10548/15526 [3:15:25<1:32:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10549/15526 [3:15:25<1:32:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10549/15526 [3:15:25<1:32:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10550/15526 [3:15:26<1:32:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10550/15526 [3:15:26<1:32:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10551/15526 [3:15:27<1:32:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10551/15526 [3:15:27<1:32:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10552/15526 [3:15:28<1:32:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10552/15526 [3:15:28<1:32:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10553/15526 [3:15:29<1:32:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10553/15526 [3:15:29<1:32:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10554/15526 [3:15:30<1:32:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10554/15526 [3:15:30<1:32:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10555/15526 [3:15:30<1:32:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10555/15526 [3:15:30<1:32:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10556/15526 [3:15:31<1:32:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10556/15526 [3:15:31<1:32:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10557/15526 [3:15:32<1:32:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10557/15526 [3:15:32<1:32:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10558/15526 [3:15:32<1:32:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10558/15526 [3:15:32<1:32:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10559/15526 [3:15:33<1:31:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10559/15526 [3:15:33<1:31:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10560/15526 [3:15:41<1:32:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10560/15526 [3:15:41<1:32:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10561/15526 [3:15:42<1:32:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10561/15526 [3:15:42<1:32:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10562/15526 [3:15:43<1:31:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10562/15526 [3:15:43<1:31:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10563/15526 [3:15:43<1:31:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10563/15526 [3:15:43<1:31:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10564/15526 [3:15:44<1:31:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10564/15526 [3:15:44<1:31:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10565/15526 [3:15:45<1:31:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10565/15526 [3:15:45<1:31:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10566/15526 [3:15:45<1:31:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10566/15526 [3:15:45<1:31:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10567/15526 [3:15:47<1:31:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10567/15526 [3:15:47<1:31:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10568/15526 [3:15:47<1:31:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10568/15526 [3:15:47<1:31:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10569/15526 [3:15:48<1:31:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10569/15526 [3:15:48<1:31:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10570/15526 [3:15:49<1:31:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10570/15526 [3:15:49<1:31:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10571/15526 [3:15:50<1:31:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10571/15526 [3:15:50<1:31:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10572/15526 [3:15:50<1:31:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10572/15526 [3:15:50<1:31:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10573/15526 [3:15:51<1:31:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10573/15526 [3:15:51<1:31:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10574/15526 [3:15:52<1:31:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10574/15526 [3:15:52<1:31:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10575/15526 [3:15:52<1:31:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10575/15526 [3:15:52<1:31:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10576/15526 [3:15:53<1:31:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10576/15526 [3:15:53<1:31:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10577/15526 [3:15:54<1:31:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10577/15526 [3:15:54<1:31:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10578/15526 [3:15:55<1:31:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10578/15526 [3:15:55<1:31:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10579/15526 [3:15:56<1:31:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10579/15526 [3:15:56<1:31:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10580/15526 [3:15:57<1:31:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10580/15526 [3:15:57<1:31:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10581/15526 [3:15:58<1:31:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10581/15526 [3:15:58<1:31:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10582/15526 [3:15:59<1:31:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10582/15526 [3:15:59<1:31:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10583/15526 [3:15:59<1:31:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10583/15526 [3:15:59<1:31:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10584/15526 [3:16:00<1:31:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10584/15526 [3:16:00<1:31:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10585/15526 [3:16:01<1:31:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10585/15526 [3:16:01<1:31:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10586/15526 [3:16:02<1:31:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10586/15526 [3:16:02<1:31:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10587/15526 [3:16:03<1:31:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10587/15526 [3:16:03<1:31:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10588/15526 [3:16:04<1:31:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10588/15526 [3:16:04<1:31:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10589/15526 [3:16:05<1:31:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10589/15526 [3:16:05<1:31:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10590/15526 [3:16:05<1:31:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10590/15526 [3:16:05<1:31:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10591/15526 [3:16:07<1:31:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10591/15526 [3:16:07<1:31:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10592/15526 [3:16:16<1:31:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10592/15526 [3:16:16<1:31:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10593/15526 [3:16:17<1:31:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10593/15526 [3:16:17<1:31:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10594/15526 [3:16:18<1:31:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10594/15526 [3:16:18<1:31:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10595/15526 [3:16:19<1:31:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10595/15526 [3:16:19<1:31:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10596/15526 [3:16:20<1:31:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10596/15526 [3:16:20<1:31:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10597/15526 [3:16:20<1:31:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10597/15526 [3:16:20<1:31:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10598/15526 [3:16:21<1:31:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10598/15526 [3:16:21<1:31:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10599/15526 [3:16:22<1:31:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10599/15526 [3:16:22<1:31:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10600/15526 [3:16:22<1:31:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10600/15526 [3:16:22<1:31:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10601/15526 [3:16:23<1:31:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10601/15526 [3:16:23<1:31:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10602/15526 [3:16:24<1:31:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10602/15526 [3:16:24<1:31:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10603/15526 [3:16:25<1:31:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10603/15526 [3:16:25<1:31:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10604/15526 [3:16:25<1:31:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10604/15526 [3:16:25<1:31:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10605/15526 [3:16:26<1:31:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10605/15526 [3:16:26<1:31:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10606/15526 [3:16:27<1:31:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10606/15526 [3:16:27<1:31:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10607/15526 [3:16:28<1:31:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10607/15526 [3:16:28<1:31:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10608/15526 [3:16:29<1:31:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10608/15526 [3:16:29<1:31:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10609/15526 [3:16:30<1:31:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10609/15526 [3:16:30<1:31:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10610/15526 [3:16:31<1:31:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10610/15526 [3:16:31<1:31:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10611/15526 [3:16:32<1:31:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10611/15526 [3:16:32<1:31:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10612/15526 [3:16:33<1:31:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10612/15526 [3:16:33<1:31:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10613/15526 [3:16:34<1:30:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10613/15526 [3:16:34<1:30:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10614/15526 [3:16:35<1:30:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10614/15526 [3:16:35<1:30:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10615/15526 [3:16:35<1:30:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10615/15526 [3:16:35<1:30:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10616/15526 [3:16:36<1:30:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10616/15526 [3:16:36<1:30:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10617/15526 [3:16:37<1:30:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10617/15526 [3:16:37<1:30:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10618/15526 [3:16:37<1:30:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10618/15526 [3:16:37<1:30:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10619/15526 [3:16:38<1:30:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10619/15526 [3:16:38<1:30:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10620/15526 [3:16:39<1:30:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10620/15526 [3:16:39<1:30:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10621/15526 [3:16:40<1:30:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10621/15526 [3:16:40<1:30:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10622/15526 [3:16:41<1:30:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10622/15526 [3:16:41<1:30:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10623/15526 [3:16:41<1:30:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10623/15526 [3:16:41<1:30:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10624/15526 [3:16:52<1:30:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10624/15526 [3:16:52<1:30:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10625/15526 [3:16:53<1:30:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10625/15526 [3:16:53<1:30:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10626/15526 [3:16:54<1:30:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10626/15526 [3:16:54<1:30:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10627/15526 [3:16:55<1:30:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10627/15526 [3:16:55<1:30:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10628/15526 [3:16:56<1:30:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10628/15526 [3:16:56<1:30:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10629/15526 [3:16:57<1:30:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10629/15526 [3:16:57<1:30:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10630/15526 [3:16:57<1:30:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10630/15526 [3:16:57<1:30:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10631/15526 [3:16:58<1:30:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10631/15526 [3:16:58<1:30:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10632/15526 [3:16:59<1:30:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10632/15526 [3:16:59<1:30:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10633/15526 [3:17:00<1:30:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10633/15526 [3:17:00<1:30:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10634/15526 [3:17:01<1:30:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10634/15526 [3:17:01<1:30:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 10635/15526 [3:17:02<1:30:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  68%|▋| 10635/15526 [3:17:02<1:30:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10636/15526 [3:17:02<1:30:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10636/15526 [3:17:02<1:30:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10637/15526 [3:17:03<1:30:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10637/15526 [3:17:03<1:30:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10638/15526 [3:17:04<1:30:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10638/15526 [3:17:04<1:30:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10639/15526 [3:17:05<1:30:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10639/15526 [3:17:05<1:30:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10640/15526 [3:17:06<1:30:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10640/15526 [3:17:06<1:30:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10641/15526 [3:17:06<1:30:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10641/15526 [3:17:06<1:30:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10642/15526 [3:17:07<1:30:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10642/15526 [3:17:07<1:30:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10643/15526 [3:17:08<1:30:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10643/15526 [3:17:08<1:30:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10644/15526 [3:17:09<1:30:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10644/15526 [3:17:09<1:30:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10645/15526 [3:17:10<1:30:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10645/15526 [3:17:10<1:30:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10646/15526 [3:17:11<1:30:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10646/15526 [3:17:11<1:30:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10647/15526 [3:17:11<1:30:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10647/15526 [3:17:11<1:30:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10648/15526 [3:17:12<1:30:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10648/15526 [3:17:12<1:30:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10649/15526 [3:17:13<1:30:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10649/15526 [3:17:13<1:30:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10650/15526 [3:17:14<1:30:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10650/15526 [3:17:14<1:30:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10651/15526 [3:17:15<1:30:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10651/15526 [3:17:15<1:30:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10652/15526 [3:17:16<1:30:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10652/15526 [3:17:16<1:30:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10653/15526 [3:17:17<1:30:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10653/15526 [3:17:17<1:30:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10654/15526 [3:17:18<1:30:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10654/15526 [3:17:18<1:30:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10655/15526 [3:17:19<1:30:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10655/15526 [3:17:19<1:30:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10656/15526 [3:17:27<1:30:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10656/15526 [3:17:27<1:30:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10657/15526 [3:17:28<1:30:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10657/15526 [3:17:28<1:30:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10658/15526 [3:17:30<1:30:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10658/15526 [3:17:30<1:30:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10659/15526 [3:17:30<1:30:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10659/15526 [3:17:30<1:30:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10660/15526 [3:17:31<1:30:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10660/15526 [3:17:31<1:30:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10661/15526 [3:17:32<1:30:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10661/15526 [3:17:32<1:30:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10662/15526 [3:17:33<1:30:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10662/15526 [3:17:33<1:30:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10663/15526 [3:17:34<1:30:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10663/15526 [3:17:34<1:30:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10664/15526 [3:17:35<1:30:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10664/15526 [3:17:35<1:30:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10665/15526 [3:17:36<1:30:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10665/15526 [3:17:36<1:30:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10666/15526 [3:17:37<1:30:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10666/15526 [3:17:37<1:30:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10667/15526 [3:17:38<1:30:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10667/15526 [3:17:38<1:30:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10668/15526 [3:17:39<1:30:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10668/15526 [3:17:39<1:30:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10669/15526 [3:17:39<1:29:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10669/15526 [3:17:39<1:29:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10670/15526 [3:17:40<1:29:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10670/15526 [3:17:40<1:29:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10671/15526 [3:17:41<1:29:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10671/15526 [3:17:41<1:29:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10672/15526 [3:17:41<1:29:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10672/15526 [3:17:41<1:29:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10673/15526 [3:17:42<1:29:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10673/15526 [3:17:42<1:29:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10674/15526 [3:17:43<1:29:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10674/15526 [3:17:43<1:29:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10675/15526 [3:17:43<1:29:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10675/15526 [3:17:43<1:29:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10676/15526 [3:17:44<1:29:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10676/15526 [3:17:44<1:29:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10677/15526 [3:17:45<1:29:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10677/15526 [3:17:45<1:29:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10678/15526 [3:17:45<1:29:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10678/15526 [3:17:45<1:29:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10679/15526 [3:17:46<1:29:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10679/15526 [3:17:46<1:29:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10680/15526 [3:17:47<1:29:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10680/15526 [3:17:47<1:29:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10681/15526 [3:17:47<1:29:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10681/15526 [3:17:47<1:29:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10682/15526 [3:17:49<1:29:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10682/15526 [3:17:49<1:29:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10683/15526 [3:17:49<1:29:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10683/15526 [3:17:49<1:29:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10684/15526 [3:17:50<1:29:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10684/15526 [3:17:50<1:29:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10685/15526 [3:17:51<1:29:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10685/15526 [3:17:51<1:29:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10686/15526 [3:17:51<1:29:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10686/15526 [3:17:51<1:29:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10687/15526 [3:17:52<1:29:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10687/15526 [3:17:52<1:29:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10688/15526 [3:18:02<1:29:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10688/15526 [3:18:02<1:29:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10689/15526 [3:18:03<1:29:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10689/15526 [3:18:03<1:29:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10690/15526 [3:18:04<1:29:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10690/15526 [3:18:04<1:29:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10691/15526 [3:18:05<1:29:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10691/15526 [3:18:05<1:29:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10692/15526 [3:18:05<1:29:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10692/15526 [3:18:05<1:29:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10693/15526 [3:18:06<1:29:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10693/15526 [3:18:06<1:29:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10694/15526 [3:18:07<1:29:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10694/15526 [3:18:07<1:29:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10695/15526 [3:18:08<1:29:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10695/15526 [3:18:08<1:29:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10696/15526 [3:18:08<1:29:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10696/15526 [3:18:08<1:29:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10697/15526 [3:18:09<1:29:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10697/15526 [3:18:09<1:29:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10698/15526 [3:18:10<1:29:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10698/15526 [3:18:10<1:29:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10699/15526 [3:18:10<1:29:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10699/15526 [3:18:10<1:29:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10700/15526 [3:18:11<1:29:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10700/15526 [3:18:11<1:29:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10701/15526 [3:18:12<1:29:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10701/15526 [3:18:12<1:29:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10702/15526 [3:18:12<1:29:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10702/15526 [3:18:12<1:29:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10703/15526 [3:18:13<1:29:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10703/15526 [3:18:13<1:29:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10704/15526 [3:18:14<1:29:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10704/15526 [3:18:14<1:29:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10705/15526 [3:18:14<1:29:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10705/15526 [3:18:14<1:29:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10706/15526 [3:18:15<1:29:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10706/15526 [3:18:15<1:29:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10707/15526 [3:18:16<1:29:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10707/15526 [3:18:16<1:29:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10708/15526 [3:18:16<1:29:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10708/15526 [3:18:16<1:29:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10709/15526 [3:18:17<1:29:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10709/15526 [3:18:17<1:29:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10710/15526 [3:18:18<1:29:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10710/15526 [3:18:18<1:29:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10711/15526 [3:18:19<1:29:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10711/15526 [3:18:19<1:29:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10712/15526 [3:18:20<1:29:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10712/15526 [3:18:20<1:29:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10713/15526 [3:18:21<1:29:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10713/15526 [3:18:21<1:29:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10714/15526 [3:18:21<1:29:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10714/15526 [3:18:21<1:29:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10715/15526 [3:18:22<1:29:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10715/15526 [3:18:22<1:29:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10716/15526 [3:18:23<1:29:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10716/15526 [3:18:23<1:29:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10717/15526 [3:18:24<1:29:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10717/15526 [3:18:24<1:29:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10718/15526 [3:18:25<1:29:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10718/15526 [3:18:25<1:29:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10719/15526 [3:18:26<1:28:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10719/15526 [3:18:26<1:28:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10720/15526 [3:18:36<1:29:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10720/15526 [3:18:36<1:29:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10721/15526 [3:18:36<1:29:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10721/15526 [3:18:36<1:29:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10722/15526 [3:18:38<1:28:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10722/15526 [3:18:38<1:28:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10723/15526 [3:18:38<1:28:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10723/15526 [3:18:38<1:28:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10724/15526 [3:18:39<1:28:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10724/15526 [3:18:39<1:28:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10725/15526 [3:18:40<1:28:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10725/15526 [3:18:40<1:28:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10726/15526 [3:18:41<1:28:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10726/15526 [3:18:41<1:28:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10727/15526 [3:18:41<1:28:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10727/15526 [3:18:41<1:28:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10728/15526 [3:18:43<1:28:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10728/15526 [3:18:43<1:28:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10729/15526 [3:18:44<1:28:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10729/15526 [3:18:44<1:28:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10730/15526 [3:18:44<1:28:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10730/15526 [3:18:44<1:28:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10731/15526 [3:18:46<1:28:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10731/15526 [3:18:46<1:28:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10732/15526 [3:18:47<1:28:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10732/15526 [3:18:47<1:28:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10733/15526 [3:18:48<1:28:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10733/15526 [3:18:48<1:28:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10734/15526 [3:18:49<1:28:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10734/15526 [3:18:49<1:28:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10735/15526 [3:18:50<1:28:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10735/15526 [3:18:50<1:28:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10736/15526 [3:18:51<1:28:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10736/15526 [3:18:51<1:28:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10737/15526 [3:18:52<1:28:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10737/15526 [3:18:52<1:28:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10738/15526 [3:18:52<1:28:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10738/15526 [3:18:52<1:28:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10739/15526 [3:18:53<1:28:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10739/15526 [3:18:53<1:28:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10740/15526 [3:18:55<1:28:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10740/15526 [3:18:55<1:28:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10741/15526 [3:18:55<1:28:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10741/15526 [3:18:55<1:28:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10742/15526 [3:18:57<1:28:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10742/15526 [3:18:57<1:28:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10743/15526 [3:18:57<1:28:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10743/15526 [3:18:57<1:28:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10744/15526 [3:18:58<1:28:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10744/15526 [3:18:58<1:28:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10745/15526 [3:18:59<1:28:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10745/15526 [3:18:59<1:28:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10746/15526 [3:19:00<1:28:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10746/15526 [3:19:00<1:28:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10747/15526 [3:19:00<1:28:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10747/15526 [3:19:00<1:28:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10748/15526 [3:19:01<1:28:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10748/15526 [3:19:01<1:28:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10749/15526 [3:19:02<1:28:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10749/15526 [3:19:02<1:28:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10750/15526 [3:19:03<1:28:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10750/15526 [3:19:03<1:28:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10751/15526 [3:19:04<1:28:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10751/15526 [3:19:04<1:28:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10752/15526 [3:19:11<1:28:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10752/15526 [3:19:11<1:28:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10753/15526 [3:19:11<1:28:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10753/15526 [3:19:11<1:28:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10754/15526 [3:19:12<1:28:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10754/15526 [3:19:12<1:28:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10755/15526 [3:19:13<1:28:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10755/15526 [3:19:13<1:28:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10756/15526 [3:19:14<1:28:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10756/15526 [3:19:14<1:28:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10757/15526 [3:19:15<1:28:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10757/15526 [3:19:15<1:28:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10758/15526 [3:19:16<1:28:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10758/15526 [3:19:16<1:28:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10759/15526 [3:19:17<1:28:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10759/15526 [3:19:17<1:28:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10760/15526 [3:19:17<1:28:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10760/15526 [3:19:17<1:28:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10761/15526 [3:19:18<1:28:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10761/15526 [3:19:18<1:28:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10762/15526 [3:19:19<1:28:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10762/15526 [3:19:19<1:28:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10763/15526 [3:19:20<1:28:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10763/15526 [3:19:20<1:28:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10764/15526 [3:19:21<1:28:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10764/15526 [3:19:21<1:28:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10765/15526 [3:19:22<1:28:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10765/15526 [3:19:22<1:28:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10766/15526 [3:19:22<1:28:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10766/15526 [3:19:22<1:28:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10767/15526 [3:19:24<1:28:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10767/15526 [3:19:24<1:28:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10768/15526 [3:19:24<1:28:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10768/15526 [3:19:24<1:28:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10769/15526 [3:19:25<1:28:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10769/15526 [3:19:25<1:28:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10770/15526 [3:19:26<1:28:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10770/15526 [3:19:26<1:28:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10771/15526 [3:19:26<1:28:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10771/15526 [3:19:26<1:28:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10772/15526 [3:19:27<1:28:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10772/15526 [3:19:27<1:28:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10773/15526 [3:19:28<1:28:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10773/15526 [3:19:28<1:28:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10774/15526 [3:19:29<1:27:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10774/15526 [3:19:29<1:27:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10775/15526 [3:19:29<1:27:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10775/15526 [3:19:29<1:27:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10776/15526 [3:19:30<1:27:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10776/15526 [3:19:30<1:27:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10777/15526 [3:19:31<1:27:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10777/15526 [3:19:31<1:27:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10778/15526 [3:19:32<1:27:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10778/15526 [3:19:32<1:27:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10779/15526 [3:19:33<1:27:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10779/15526 [3:19:33<1:27:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10780/15526 [3:19:33<1:27:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10780/15526 [3:19:33<1:27:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10781/15526 [3:19:34<1:27:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10781/15526 [3:19:34<1:27:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10782/15526 [3:19:35<1:27:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10782/15526 [3:19:35<1:27:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10783/15526 [3:19:36<1:27:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10783/15526 [3:19:36<1:27:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10784/15526 [3:19:44<1:27:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10784/15526 [3:19:44<1:27:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10785/15526 [3:19:45<1:27:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10785/15526 [3:19:45<1:27:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10786/15526 [3:19:46<1:27:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10786/15526 [3:19:46<1:27:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10787/15526 [3:19:47<1:27:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10787/15526 [3:19:47<1:27:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10788/15526 [3:19:47<1:27:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10788/15526 [3:19:47<1:27:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10789/15526 [3:19:48<1:27:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10789/15526 [3:19:48<1:27:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 10790/15526 [3:19:49<1:27:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  69%|▋| 10790/15526 [3:19:49<1:27:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10791/15526 [3:19:50<1:27:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10791/15526 [3:19:50<1:27:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10792/15526 [3:19:51<1:27:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10792/15526 [3:19:51<1:27:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10793/15526 [3:19:52<1:27:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10793/15526 [3:19:52<1:27:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10794/15526 [3:19:53<1:27:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10794/15526 [3:19:53<1:27:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10795/15526 [3:19:54<1:27:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10795/15526 [3:19:54<1:27:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10796/15526 [3:19:55<1:27:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10796/15526 [3:19:55<1:27:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10797/15526 [3:19:55<1:27:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10797/15526 [3:19:55<1:27:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10798/15526 [3:19:57<1:27:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10798/15526 [3:19:57<1:27:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10799/15526 [3:19:57<1:27:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10799/15526 [3:19:57<1:27:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10800/15526 [3:19:58<1:27:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10800/15526 [3:19:58<1:27:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10801/15526 [3:19:59<1:27:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10801/15526 [3:19:59<1:27:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10802/15526 [3:19:59<1:27:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10802/15526 [3:19:59<1:27:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10803/15526 [3:20:00<1:27:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10803/15526 [3:20:00<1:27:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10804/15526 [3:20:01<1:27:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10804/15526 [3:20:01<1:27:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10805/15526 [3:20:01<1:27:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10805/15526 [3:20:01<1:27:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10806/15526 [3:20:03<1:27:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10806/15526 [3:20:03<1:27:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10807/15526 [3:20:04<1:27:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10807/15526 [3:20:04<1:27:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10808/15526 [3:20:05<1:27:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10808/15526 [3:20:05<1:27:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10809/15526 [3:20:06<1:27:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10809/15526 [3:20:06<1:27:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10810/15526 [3:20:07<1:27:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10810/15526 [3:20:07<1:27:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10811/15526 [3:20:08<1:27:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10811/15526 [3:20:08<1:27:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10812/15526 [3:20:09<1:27:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10812/15526 [3:20:09<1:27:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10813/15526 [3:20:09<1:27:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10813/15526 [3:20:09<1:27:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10814/15526 [3:20:10<1:27:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10814/15526 [3:20:10<1:27:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10815/15526 [3:20:11<1:27:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10815/15526 [3:20:11<1:27:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10816/15526 [3:20:18<1:27:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10816/15526 [3:20:18<1:27:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10817/15526 [3:20:18<1:27:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10817/15526 [3:20:18<1:27:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10818/15526 [3:20:20<1:27:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10818/15526 [3:20:20<1:27:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10819/15526 [3:20:21<1:27:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10819/15526 [3:20:21<1:27:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10820/15526 [3:20:22<1:27:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10820/15526 [3:20:22<1:27:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10821/15526 [3:20:23<1:27:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10821/15526 [3:20:23<1:27:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10822/15526 [3:20:23<1:27:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10822/15526 [3:20:23<1:27:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10823/15526 [3:20:25<1:27:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10823/15526 [3:20:25<1:27:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10824/15526 [3:20:26<1:27:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10824/15526 [3:20:26<1:27:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10825/15526 [3:20:26<1:27:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10825/15526 [3:20:26<1:27:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10826/15526 [3:20:27<1:27:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10826/15526 [3:20:27<1:27:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10827/15526 [3:20:28<1:27:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10827/15526 [3:20:28<1:27:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10828/15526 [3:20:29<1:26:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10828/15526 [3:20:29<1:26:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10829/15526 [3:20:30<1:26:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10829/15526 [3:20:30<1:26:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10830/15526 [3:20:31<1:26:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10830/15526 [3:20:31<1:26:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10831/15526 [3:20:31<1:26:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10831/15526 [3:20:31<1:26:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10832/15526 [3:20:32<1:26:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10832/15526 [3:20:32<1:26:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10833/15526 [3:20:33<1:26:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10833/15526 [3:20:33<1:26:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10834/15526 [3:20:34<1:26:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10834/15526 [3:20:34<1:26:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10835/15526 [3:20:35<1:26:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10835/15526 [3:20:35<1:26:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10836/15526 [3:20:36<1:26:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10836/15526 [3:20:36<1:26:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10837/15526 [3:20:37<1:26:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10837/15526 [3:20:37<1:26:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10838/15526 [3:20:38<1:26:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10838/15526 [3:20:38<1:26:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10839/15526 [3:20:39<1:26:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10839/15526 [3:20:39<1:26:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10840/15526 [3:20:40<1:26:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10840/15526 [3:20:40<1:26:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10841/15526 [3:20:41<1:26:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10841/15526 [3:20:41<1:26:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10842/15526 [3:20:42<1:26:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10842/15526 [3:20:42<1:26:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10843/15526 [3:20:43<1:26:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10843/15526 [3:20:43<1:26:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10844/15526 [3:20:43<1:26:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10844/15526 [3:20:43<1:26:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10845/15526 [3:20:44<1:26:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10845/15526 [3:20:44<1:26:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10846/15526 [3:20:45<1:26:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10846/15526 [3:20:45<1:26:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10847/15526 [3:20:46<1:26:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10847/15526 [3:20:46<1:26:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10848/15526 [3:20:52<1:26:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10848/15526 [3:20:52<1:26:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10849/15526 [3:20:53<1:26:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10849/15526 [3:20:53<1:26:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10850/15526 [3:20:54<1:26:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10850/15526 [3:20:54<1:26:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10851/15526 [3:20:55<1:26:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10851/15526 [3:20:55<1:26:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10852/15526 [3:20:55<1:26:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10852/15526 [3:20:55<1:26:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10853/15526 [3:20:56<1:26:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10853/15526 [3:20:56<1:26:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10854/15526 [3:20:57<1:26:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10854/15526 [3:20:57<1:26:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10855/15526 [3:20:57<1:26:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10855/15526 [3:20:57<1:26:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10856/15526 [3:20:58<1:26:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10856/15526 [3:20:58<1:26:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10857/15526 [3:20:59<1:26:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10857/15526 [3:20:59<1:26:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10858/15526 [3:21:00<1:26:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10858/15526 [3:21:00<1:26:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10859/15526 [3:21:00<1:26:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10859/15526 [3:21:00<1:26:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10860/15526 [3:21:01<1:26:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10860/15526 [3:21:01<1:26:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10861/15526 [3:21:02<1:26:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10861/15526 [3:21:02<1:26:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10862/15526 [3:21:03<1:26:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10862/15526 [3:21:03<1:26:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10863/15526 [3:21:04<1:26:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10863/15526 [3:21:04<1:26:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10864/15526 [3:21:05<1:26:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10864/15526 [3:21:05<1:26:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10865/15526 [3:21:06<1:26:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10865/15526 [3:21:06<1:26:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10866/15526 [3:21:08<1:26:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10866/15526 [3:21:08<1:26:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10867/15526 [3:21:09<1:26:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10867/15526 [3:21:09<1:26:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10868/15526 [3:21:10<1:26:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10868/15526 [3:21:10<1:26:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10869/15526 [3:21:10<1:26:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10869/15526 [3:21:10<1:26:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10870/15526 [3:21:11<1:26:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10870/15526 [3:21:11<1:26:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10871/15526 [3:21:13<1:26:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10871/15526 [3:21:13<1:26:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10872/15526 [3:21:14<1:26:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10872/15526 [3:21:14<1:26:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10873/15526 [3:21:15<1:26:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10873/15526 [3:21:15<1:26:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10874/15526 [3:21:16<1:26:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10874/15526 [3:21:16<1:26:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10875/15526 [3:21:16<1:26:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10875/15526 [3:21:16<1:26:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10876/15526 [3:21:17<1:26:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10876/15526 [3:21:17<1:26:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10877/15526 [3:21:18<1:26:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10877/15526 [3:21:18<1:26:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10878/15526 [3:21:18<1:26:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10878/15526 [3:21:18<1:26:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10879/15526 [3:21:20<1:26:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10879/15526 [3:21:20<1:26:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10880/15526 [3:21:26<1:26:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10880/15526 [3:21:26<1:26:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10881/15526 [3:21:27<1:26:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10881/15526 [3:21:27<1:26:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10882/15526 [3:21:28<1:25:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10882/15526 [3:21:28<1:25:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10883/15526 [3:21:29<1:25:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10883/15526 [3:21:29<1:25:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10884/15526 [3:21:30<1:25:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10884/15526 [3:21:30<1:25:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10885/15526 [3:21:31<1:25:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10885/15526 [3:21:31<1:25:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10886/15526 [3:21:32<1:25:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10886/15526 [3:21:32<1:25:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10887/15526 [3:21:33<1:25:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10887/15526 [3:21:33<1:25:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10888/15526 [3:21:33<1:25:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10888/15526 [3:21:33<1:25:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10889/15526 [3:21:35<1:25:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10889/15526 [3:21:35<1:25:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10890/15526 [3:21:35<1:25:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10890/15526 [3:21:35<1:25:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10891/15526 [3:21:36<1:25:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10891/15526 [3:21:36<1:25:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10892/15526 [3:21:37<1:25:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10892/15526 [3:21:37<1:25:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10893/15526 [3:21:37<1:25:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10893/15526 [3:21:37<1:25:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10894/15526 [3:21:38<1:25:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10894/15526 [3:21:38<1:25:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10895/15526 [3:21:40<1:25:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10895/15526 [3:21:40<1:25:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10896/15526 [3:21:41<1:25:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10896/15526 [3:21:41<1:25:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10897/15526 [3:21:42<1:25:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10897/15526 [3:21:42<1:25:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10898/15526 [3:21:43<1:25:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10898/15526 [3:21:43<1:25:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10899/15526 [3:21:43<1:25:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10899/15526 [3:21:43<1:25:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10900/15526 [3:21:44<1:25:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10900/15526 [3:21:44<1:25:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10901/15526 [3:21:45<1:25:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10901/15526 [3:21:45<1:25:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10902/15526 [3:21:46<1:25:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10902/15526 [3:21:46<1:25:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10903/15526 [3:21:47<1:25:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10903/15526 [3:21:47<1:25:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10904/15526 [3:21:47<1:25:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10904/15526 [3:21:47<1:25:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10905/15526 [3:21:48<1:25:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10905/15526 [3:21:48<1:25:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10906/15526 [3:21:49<1:25:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10906/15526 [3:21:49<1:25:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10907/15526 [3:21:49<1:25:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10907/15526 [3:21:49<1:25:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10908/15526 [3:21:51<1:25:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10908/15526 [3:21:51<1:25:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10909/15526 [3:21:52<1:25:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10909/15526 [3:21:52<1:25:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10910/15526 [3:21:53<1:25:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10910/15526 [3:21:53<1:25:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10911/15526 [3:21:54<1:25:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10911/15526 [3:21:54<1:25:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10912/15526 [3:22:02<1:25:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10912/15526 [3:22:02<1:25:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10913/15526 [3:22:02<1:25:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10913/15526 [3:22:02<1:25:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10914/15526 [3:22:03<1:25:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10914/15526 [3:22:03<1:25:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10915/15526 [3:22:04<1:25:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10915/15526 [3:22:04<1:25:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10916/15526 [3:22:05<1:25:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10916/15526 [3:22:05<1:25:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10917/15526 [3:22:06<1:25:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10917/15526 [3:22:06<1:25:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10918/15526 [3:22:06<1:25:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10918/15526 [3:22:06<1:25:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10919/15526 [3:22:07<1:25:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10919/15526 [3:22:07<1:25:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10920/15526 [3:22:08<1:25:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10920/15526 [3:22:08<1:25:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10921/15526 [3:22:08<1:25:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10921/15526 [3:22:08<1:25:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10922/15526 [3:22:09<1:25:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10922/15526 [3:22:09<1:25:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10923/15526 [3:22:10<1:25:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10923/15526 [3:22:10<1:25:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10924/15526 [3:22:10<1:25:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10924/15526 [3:22:10<1:25:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10925/15526 [3:22:11<1:25:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10925/15526 [3:22:11<1:25:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10926/15526 [3:22:12<1:25:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10926/15526 [3:22:12<1:25:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10927/15526 [3:22:13<1:25:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10927/15526 [3:22:13<1:25:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10928/15526 [3:22:14<1:25:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10928/15526 [3:22:14<1:25:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10929/15526 [3:22:15<1:25:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10929/15526 [3:22:15<1:25:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10930/15526 [3:22:15<1:25:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10930/15526 [3:22:15<1:25:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10931/15526 [3:22:16<1:25:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10931/15526 [3:22:16<1:25:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10932/15526 [3:22:17<1:25:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10932/15526 [3:22:17<1:25:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10933/15526 [3:22:18<1:24:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10933/15526 [3:22:18<1:24:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10934/15526 [3:22:19<1:24:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10934/15526 [3:22:19<1:24:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10935/15526 [3:22:20<1:24:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10935/15526 [3:22:20<1:24:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10936/15526 [3:22:21<1:24:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10936/15526 [3:22:21<1:24:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10937/15526 [3:22:22<1:24:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10937/15526 [3:22:22<1:24:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10938/15526 [3:22:23<1:24:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10938/15526 [3:22:23<1:24:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10939/15526 [3:22:24<1:24:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10939/15526 [3:22:24<1:24:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10940/15526 [3:22:24<1:24:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10940/15526 [3:22:24<1:24:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10941/15526 [3:22:26<1:24:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10941/15526 [3:22:26<1:24:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10942/15526 [3:22:26<1:24:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10942/15526 [3:22:26<1:24:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10943/15526 [3:22:27<1:24:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10943/15526 [3:22:27<1:24:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10944/15526 [3:22:37<1:24:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10944/15526 [3:22:37<1:24:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 10945/15526 [3:22:37<1:24:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  70%|▋| 10945/15526 [3:22:37<1:24:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10946/15526 [3:22:38<1:24:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10946/15526 [3:22:38<1:24:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10947/15526 [3:22:39<1:24:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10947/15526 [3:22:39<1:24:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10948/15526 [3:22:39<1:24:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10948/15526 [3:22:39<1:24:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10949/15526 [3:22:40<1:24:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10949/15526 [3:22:40<1:24:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10950/15526 [3:22:41<1:24:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10950/15526 [3:22:41<1:24:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10951/15526 [3:22:41<1:24:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10951/15526 [3:22:41<1:24:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10952/15526 [3:22:42<1:24:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10952/15526 [3:22:42<1:24:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10953/15526 [3:22:43<1:24:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10953/15526 [3:22:43<1:24:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10954/15526 [3:22:44<1:24:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10954/15526 [3:22:44<1:24:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10955/15526 [3:22:45<1:24:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10955/15526 [3:22:45<1:24:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10956/15526 [3:22:46<1:24:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10956/15526 [3:22:46<1:24:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10957/15526 [3:22:47<1:24:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10957/15526 [3:22:47<1:24:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10958/15526 [3:22:48<1:24:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10958/15526 [3:22:48<1:24:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10959/15526 [3:22:49<1:24:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10959/15526 [3:22:49<1:24:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10960/15526 [3:22:50<1:24:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10960/15526 [3:22:50<1:24:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10961/15526 [3:22:51<1:24:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10961/15526 [3:22:51<1:24:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10962/15526 [3:22:52<1:24:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10962/15526 [3:22:52<1:24:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10963/15526 [3:22:53<1:24:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10963/15526 [3:22:53<1:24:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10964/15526 [3:22:53<1:24:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10964/15526 [3:22:53<1:24:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10965/15526 [3:22:54<1:24:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10965/15526 [3:22:54<1:24:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10966/15526 [3:22:55<1:24:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10966/15526 [3:22:55<1:24:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10967/15526 [3:22:56<1:24:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10967/15526 [3:22:56<1:24:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10968/15526 [3:22:57<1:24:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10968/15526 [3:22:57<1:24:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10969/15526 [3:22:58<1:24:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10969/15526 [3:22:58<1:24:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10970/15526 [3:22:59<1:24:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10970/15526 [3:22:59<1:24:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10971/15526 [3:22:59<1:24:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10971/15526 [3:22:59<1:24:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10972/15526 [3:23:01<1:24:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10972/15526 [3:23:01<1:24:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10973/15526 [3:23:01<1:24:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10973/15526 [3:23:01<1:24:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10974/15526 [3:23:02<1:24:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10974/15526 [3:23:02<1:24:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10975/15526 [3:23:04<1:24:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10975/15526 [3:23:04<1:24:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10976/15526 [3:23:11<1:24:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10976/15526 [3:23:11<1:24:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10977/15526 [3:23:12<1:24:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10977/15526 [3:23:12<1:24:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10978/15526 [3:23:12<1:24:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10978/15526 [3:23:12<1:24:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10979/15526 [3:23:13<1:24:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10979/15526 [3:23:13<1:24:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10980/15526 [3:23:14<1:24:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10980/15526 [3:23:14<1:24:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10981/15526 [3:23:15<1:24:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10981/15526 [3:23:15<1:24:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10982/15526 [3:23:16<1:24:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10982/15526 [3:23:16<1:24:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10983/15526 [3:23:17<1:24:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10983/15526 [3:23:17<1:24:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10984/15526 [3:23:17<1:24:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10984/15526 [3:23:17<1:24:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10985/15526 [3:23:18<1:24:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10985/15526 [3:23:18<1:24:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10986/15526 [3:23:19<1:24:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10986/15526 [3:23:19<1:24:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10987/15526 [3:23:20<1:24:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10987/15526 [3:23:20<1:24:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10988/15526 [3:23:21<1:23:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10988/15526 [3:23:21<1:23:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10989/15526 [3:23:22<1:23:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10989/15526 [3:23:22<1:23:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10990/15526 [3:23:23<1:23:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10990/15526 [3:23:23<1:23:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10991/15526 [3:23:23<1:23:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10991/15526 [3:23:23<1:23:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10992/15526 [3:23:24<1:23:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10992/15526 [3:23:24<1:23:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10993/15526 [3:23:25<1:23:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10993/15526 [3:23:25<1:23:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10994/15526 [3:23:26<1:23:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10994/15526 [3:23:26<1:23:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10995/15526 [3:23:26<1:23:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10995/15526 [3:23:26<1:23:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10996/15526 [3:23:28<1:23:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10996/15526 [3:23:28<1:23:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10997/15526 [3:23:28<1:23:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10997/15526 [3:23:28<1:23:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10998/15526 [3:23:29<1:23:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10998/15526 [3:23:29<1:23:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 10999/15526 [3:23:30<1:23:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 10999/15526 [3:23:30<1:23:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11000/15526 [3:23:31<1:23:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11000/15526 [3:23:31<1:23:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11001/15526 [3:23:32<1:23:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11001/15526 [3:23:32<1:23:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11002/15526 [3:23:33<1:23:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11002/15526 [3:23:33<1:23:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11003/15526 [3:23:33<1:23:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11003/15526 [3:23:33<1:23:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11004/15526 [3:23:35<1:23:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11004/15526 [3:23:35<1:23:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11005/15526 [3:23:35<1:23:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11005/15526 [3:23:35<1:23:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11006/15526 [3:23:36<1:23:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11006/15526 [3:23:36<1:23:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11007/15526 [3:23:37<1:23:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11007/15526 [3:23:37<1:23:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11008/15526 [3:23:45<1:23:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11008/15526 [3:23:45<1:23:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11009/15526 [3:23:45<1:23:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11009/15526 [3:23:45<1:23:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11010/15526 [3:23:47<1:23:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11010/15526 [3:23:47<1:23:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11011/15526 [3:23:48<1:23:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11011/15526 [3:23:48<1:23:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11012/15526 [3:23:49<1:23:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11012/15526 [3:23:49<1:23:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11013/15526 [3:23:50<1:23:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11013/15526 [3:23:50<1:23:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11014/15526 [3:23:51<1:23:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11014/15526 [3:23:51<1:23:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11015/15526 [3:23:51<1:23:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11015/15526 [3:23:51<1:23:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11016/15526 [3:23:52<1:23:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11016/15526 [3:23:52<1:23:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11017/15526 [3:23:53<1:23:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11017/15526 [3:23:53<1:23:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11018/15526 [3:23:54<1:23:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11018/15526 [3:23:54<1:23:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11019/15526 [3:23:55<1:23:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11019/15526 [3:23:55<1:23:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11020/15526 [3:23:56<1:23:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11020/15526 [3:23:56<1:23:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11021/15526 [3:23:57<1:23:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11021/15526 [3:23:57<1:23:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11022/15526 [3:23:57<1:23:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11022/15526 [3:23:57<1:23:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11023/15526 [3:23:58<1:23:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11023/15526 [3:23:58<1:23:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11024/15526 [3:23:59<1:23:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11024/15526 [3:23:59<1:23:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11025/15526 [3:24:00<1:23:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11025/15526 [3:24:00<1:23:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11026/15526 [3:24:01<1:23:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11026/15526 [3:24:01<1:23:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11027/15526 [3:24:01<1:23:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11027/15526 [3:24:01<1:23:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11028/15526 [3:24:02<1:23:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11028/15526 [3:24:02<1:23:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11029/15526 [3:24:03<1:23:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11029/15526 [3:24:03<1:23:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11030/15526 [3:24:04<1:23:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11030/15526 [3:24:04<1:23:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11031/15526 [3:24:05<1:23:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11031/15526 [3:24:05<1:23:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11032/15526 [3:24:05<1:23:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11032/15526 [3:24:05<1:23:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11033/15526 [3:24:06<1:23:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11033/15526 [3:24:06<1:23:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11034/15526 [3:24:07<1:23:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11034/15526 [3:24:07<1:23:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11035/15526 [3:24:07<1:23:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11035/15526 [3:24:07<1:23:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11036/15526 [3:24:08<1:23:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11036/15526 [3:24:08<1:23:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11037/15526 [3:24:09<1:23:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11037/15526 [3:24:09<1:23:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11038/15526 [3:24:10<1:23:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11038/15526 [3:24:10<1:23:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11039/15526 [3:24:10<1:22:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11039/15526 [3:24:10<1:22:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11040/15526 [3:24:18<1:23:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11040/15526 [3:24:18<1:23:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11041/15526 [3:24:19<1:22:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11041/15526 [3:24:19<1:22:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11042/15526 [3:24:20<1:22:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11042/15526 [3:24:20<1:22:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11043/15526 [3:24:21<1:22:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11043/15526 [3:24:21<1:22:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11044/15526 [3:24:22<1:22:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11044/15526 [3:24:22<1:22:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11045/15526 [3:24:23<1:22:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11045/15526 [3:24:23<1:22:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11046/15526 [3:24:24<1:22:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11046/15526 [3:24:24<1:22:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11047/15526 [3:24:25<1:22:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11047/15526 [3:24:25<1:22:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11048/15526 [3:24:25<1:22:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11048/15526 [3:24:25<1:22:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11049/15526 [3:24:26<1:22:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11049/15526 [3:24:26<1:22:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11050/15526 [3:24:27<1:22:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11050/15526 [3:24:27<1:22:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11051/15526 [3:24:27<1:22:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11051/15526 [3:24:27<1:22:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11052/15526 [3:24:28<1:22:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11052/15526 [3:24:28<1:22:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11053/15526 [3:24:29<1:22:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11053/15526 [3:24:29<1:22:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11054/15526 [3:24:30<1:22:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11054/15526 [3:24:30<1:22:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11055/15526 [3:24:32<1:22:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11055/15526 [3:24:32<1:22:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11056/15526 [3:24:32<1:22:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11056/15526 [3:24:32<1:22:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11057/15526 [3:24:33<1:22:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11057/15526 [3:24:33<1:22:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11058/15526 [3:24:34<1:22:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11058/15526 [3:24:34<1:22:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11059/15526 [3:24:35<1:22:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11059/15526 [3:24:35<1:22:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11060/15526 [3:24:36<1:22:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11060/15526 [3:24:36<1:22:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11061/15526 [3:24:37<1:22:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11061/15526 [3:24:37<1:22:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11062/15526 [3:24:38<1:22:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11062/15526 [3:24:38<1:22:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11063/15526 [3:24:39<1:22:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11063/15526 [3:24:39<1:22:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11064/15526 [3:24:39<1:22:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11064/15526 [3:24:39<1:22:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11065/15526 [3:24:40<1:22:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11065/15526 [3:24:40<1:22:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11066/15526 [3:24:41<1:22:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11066/15526 [3:24:41<1:22:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11067/15526 [3:24:41<1:22:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11067/15526 [3:24:41<1:22:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11068/15526 [3:24:42<1:22:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11068/15526 [3:24:42<1:22:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11069/15526 [3:24:43<1:22:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11069/15526 [3:24:43<1:22:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11070/15526 [3:24:44<1:22:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11070/15526 [3:24:44<1:22:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11071/15526 [3:24:46<1:22:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11071/15526 [3:24:46<1:22:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11072/15526 [3:24:52<1:22:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11072/15526 [3:24:52<1:22:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11073/15526 [3:24:53<1:22:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11073/15526 [3:24:53<1:22:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11074/15526 [3:24:53<1:22:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11074/15526 [3:24:53<1:22:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11075/15526 [3:24:54<1:22:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11075/15526 [3:24:54<1:22:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11076/15526 [3:24:55<1:22:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11076/15526 [3:24:55<1:22:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11077/15526 [3:24:55<1:22:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11077/15526 [3:24:55<1:22:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11078/15526 [3:24:56<1:22:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11078/15526 [3:24:56<1:22:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11079/15526 [3:24:57<1:22:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11079/15526 [3:24:57<1:22:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11080/15526 [3:24:58<1:22:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11080/15526 [3:24:58<1:22:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11081/15526 [3:25:00<1:22:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11081/15526 [3:25:00<1:22:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11082/15526 [3:25:00<1:22:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11082/15526 [3:25:00<1:22:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11083/15526 [3:25:01<1:22:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11083/15526 [3:25:01<1:22:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11084/15526 [3:25:02<1:22:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11084/15526 [3:25:02<1:22:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11085/15526 [3:25:02<1:22:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11085/15526 [3:25:02<1:22:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11086/15526 [3:25:03<1:22:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11086/15526 [3:25:03<1:22:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11087/15526 [3:25:04<1:22:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11087/15526 [3:25:04<1:22:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11088/15526 [3:25:05<1:22:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11088/15526 [3:25:05<1:22:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11089/15526 [3:25:06<1:22:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11089/15526 [3:25:06<1:22:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11090/15526 [3:25:07<1:22:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11090/15526 [3:25:07<1:22:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11091/15526 [3:25:08<1:22:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11091/15526 [3:25:08<1:22:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11092/15526 [3:25:09<1:22:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11092/15526 [3:25:09<1:22:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11093/15526 [3:25:10<1:21:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11093/15526 [3:25:10<1:21:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11094/15526 [3:25:11<1:21:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11094/15526 [3:25:11<1:21:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11095/15526 [3:25:12<1:21:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11095/15526 [3:25:12<1:21:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11096/15526 [3:25:12<1:21:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11096/15526 [3:25:12<1:21:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11097/15526 [3:25:13<1:21:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11097/15526 [3:25:13<1:21:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11098/15526 [3:25:14<1:21:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11098/15526 [3:25:14<1:21:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11099/15526 [3:25:15<1:21:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11099/15526 [3:25:15<1:21:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11100/15526 [3:25:16<1:21:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11100/15526 [3:25:16<1:21:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 11101/15526 [3:25:17<1:21:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  71%|▋| 11101/15526 [3:25:17<1:21:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11102/15526 [3:25:17<1:21:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11102/15526 [3:25:17<1:21:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11103/15526 [3:25:18<1:21:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11103/15526 [3:25:18<1:21:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11104/15526 [3:25:27<1:21:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11104/15526 [3:25:27<1:21:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11105/15526 [3:25:28<1:21:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11105/15526 [3:25:28<1:21:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11106/15526 [3:25:29<1:21:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11106/15526 [3:25:29<1:21:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11107/15526 [3:25:29<1:21:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11107/15526 [3:25:29<1:21:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11108/15526 [3:25:31<1:21:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11108/15526 [3:25:31<1:21:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11109/15526 [3:25:31<1:21:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11109/15526 [3:25:31<1:21:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11110/15526 [3:25:32<1:21:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11110/15526 [3:25:32<1:21:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11111/15526 [3:25:33<1:21:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11111/15526 [3:25:33<1:21:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11112/15526 [3:25:35<1:21:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11112/15526 [3:25:35<1:21:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11113/15526 [3:25:35<1:21:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11113/15526 [3:25:35<1:21:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11114/15526 [3:25:36<1:21:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11114/15526 [3:25:36<1:21:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11115/15526 [3:25:37<1:21:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11115/15526 [3:25:37<1:21:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11116/15526 [3:25:37<1:21:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11116/15526 [3:25:37<1:21:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11117/15526 [3:25:38<1:21:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11117/15526 [3:25:38<1:21:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11118/15526 [3:25:39<1:21:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11118/15526 [3:25:39<1:21:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11119/15526 [3:25:39<1:21:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11119/15526 [3:25:39<1:21:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11120/15526 [3:25:41<1:21:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11120/15526 [3:25:41<1:21:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11121/15526 [3:25:41<1:21:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11121/15526 [3:25:41<1:21:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11122/15526 [3:25:42<1:21:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11122/15526 [3:25:42<1:21:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11123/15526 [3:25:43<1:21:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11123/15526 [3:25:43<1:21:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11124/15526 [3:25:44<1:21:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11124/15526 [3:25:44<1:21:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11125/15526 [3:25:45<1:21:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11125/15526 [3:25:45<1:21:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11126/15526 [3:25:46<1:21:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11126/15526 [3:25:46<1:21:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11127/15526 [3:25:46<1:21:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11127/15526 [3:25:46<1:21:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11128/15526 [3:25:47<1:21:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11128/15526 [3:25:47<1:21:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11129/15526 [3:25:48<1:21:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11129/15526 [3:25:48<1:21:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11130/15526 [3:25:49<1:21:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11130/15526 [3:25:49<1:21:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11131/15526 [3:25:49<1:21:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11131/15526 [3:25:49<1:21:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11132/15526 [3:25:50<1:21:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11132/15526 [3:25:50<1:21:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11133/15526 [3:25:51<1:21:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11133/15526 [3:25:51<1:21:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11134/15526 [3:25:52<1:21:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11134/15526 [3:25:52<1:21:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11135/15526 [3:25:52<1:21:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11135/15526 [3:25:52<1:21:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11136/15526 [3:26:02<1:21:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11136/15526 [3:26:02<1:21:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11137/15526 [3:26:04<1:21:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11137/15526 [3:26:04<1:21:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11138/15526 [3:26:04<1:21:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11138/15526 [3:26:04<1:21:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11139/15526 [3:26:05<1:21:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11139/15526 [3:26:05<1:21:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11140/15526 [3:26:06<1:21:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11140/15526 [3:26:06<1:21:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11141/15526 [3:26:07<1:21:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11141/15526 [3:26:07<1:21:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11142/15526 [3:26:08<1:21:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11142/15526 [3:26:08<1:21:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11143/15526 [3:26:09<1:21:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11143/15526 [3:26:09<1:21:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11144/15526 [3:26:09<1:21:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11144/15526 [3:26:09<1:21:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11145/15526 [3:26:10<1:21:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11145/15526 [3:26:10<1:21:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11146/15526 [3:26:11<1:21:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11146/15526 [3:26:11<1:21:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11147/15526 [3:26:11<1:21:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11147/15526 [3:26:11<1:21:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11148/15526 [3:26:12<1:20:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11148/15526 [3:26:12<1:20:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11149/15526 [3:26:13<1:20:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11149/15526 [3:26:13<1:20:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11150/15526 [3:26:14<1:20:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11150/15526 [3:26:14<1:20:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11151/15526 [3:26:15<1:20:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11151/15526 [3:26:15<1:20:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11152/15526 [3:26:16<1:20:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11152/15526 [3:26:16<1:20:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11153/15526 [3:26:18<1:20:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11153/15526 [3:26:18<1:20:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11154/15526 [3:26:19<1:20:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11154/15526 [3:26:19<1:20:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11155/15526 [3:26:19<1:20:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11155/15526 [3:26:19<1:20:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11156/15526 [3:26:20<1:20:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11156/15526 [3:26:20<1:20:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11157/15526 [3:26:21<1:20:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11157/15526 [3:26:21<1:20:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11158/15526 [3:26:21<1:20:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11158/15526 [3:26:21<1:20:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11159/15526 [3:26:22<1:20:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11159/15526 [3:26:22<1:20:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11160/15526 [3:26:23<1:20:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11160/15526 [3:26:23<1:20:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11161/15526 [3:26:24<1:20:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11161/15526 [3:26:24<1:20:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11162/15526 [3:26:25<1:20:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11162/15526 [3:26:25<1:20:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11163/15526 [3:26:25<1:20:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11163/15526 [3:26:25<1:20:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11164/15526 [3:26:27<1:20:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11164/15526 [3:26:27<1:20:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11165/15526 [3:26:28<1:20:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11165/15526 [3:26:28<1:20:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11166/15526 [3:26:29<1:20:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11166/15526 [3:26:29<1:20:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11167/15526 [3:26:30<1:20:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11167/15526 [3:26:30<1:20:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11168/15526 [3:26:38<1:20:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11168/15526 [3:26:38<1:20:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11169/15526 [3:26:39<1:20:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11169/15526 [3:26:39<1:20:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11170/15526 [3:26:40<1:20:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11170/15526 [3:26:40<1:20:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11171/15526 [3:26:41<1:20:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11171/15526 [3:26:41<1:20:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11172/15526 [3:26:41<1:20:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11172/15526 [3:26:41<1:20:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11173/15526 [3:26:42<1:20:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11173/15526 [3:26:42<1:20:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11174/15526 [3:26:43<1:20:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11174/15526 [3:26:43<1:20:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11175/15526 [3:26:44<1:20:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11175/15526 [3:26:44<1:20:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11176/15526 [3:26:44<1:20:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11176/15526 [3:26:44<1:20:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11177/15526 [3:26:45<1:20:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11177/15526 [3:26:45<1:20:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11178/15526 [3:26:46<1:20:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11178/15526 [3:26:46<1:20:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11179/15526 [3:26:47<1:20:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11179/15526 [3:26:47<1:20:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11180/15526 [3:26:47<1:20:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11180/15526 [3:26:47<1:20:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11181/15526 [3:26:48<1:20:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11181/15526 [3:26:48<1:20:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11182/15526 [3:26:49<1:20:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11182/15526 [3:26:49<1:20:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11183/15526 [3:26:50<1:20:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11183/15526 [3:26:50<1:20:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11184/15526 [3:26:51<1:20:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11184/15526 [3:26:51<1:20:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11185/15526 [3:26:52<1:20:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11185/15526 [3:26:52<1:20:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11186/15526 [3:26:53<1:20:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11186/15526 [3:26:53<1:20:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11187/15526 [3:26:54<1:20:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11187/15526 [3:26:54<1:20:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11188/15526 [3:26:55<1:20:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11188/15526 [3:26:55<1:20:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11189/15526 [3:26:55<1:20:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11189/15526 [3:26:55<1:20:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11190/15526 [3:26:56<1:20:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11190/15526 [3:26:56<1:20:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11191/15526 [3:26:57<1:20:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11191/15526 [3:26:57<1:20:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11192/15526 [3:26:57<1:20:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11192/15526 [3:26:57<1:20:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11193/15526 [3:26:58<1:20:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11193/15526 [3:26:58<1:20:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11194/15526 [3:26:59<1:20:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11194/15526 [3:26:59<1:20:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11195/15526 [3:26:59<1:20:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11195/15526 [3:26:59<1:20:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11196/15526 [3:27:00<1:20:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11196/15526 [3:27:00<1:20:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11197/15526 [3:27:01<1:20:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11197/15526 [3:27:01<1:20:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11198/15526 [3:27:02<1:20:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11198/15526 [3:27:02<1:20:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11199/15526 [3:27:03<1:19:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11199/15526 [3:27:03<1:19:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11200/15526 [3:27:12<1:20:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11200/15526 [3:27:12<1:20:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11201/15526 [3:27:36<1:20:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11201/15526 [3:27:36<1:20:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11202/15526 [3:27:37<1:20:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11202/15526 [3:27:37<1:20:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11203/15526 [3:27:38<1:20:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11203/15526 [3:27:38<1:20:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11204/15526 [3:27:39<1:20:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11204/15526 [3:27:39<1:20:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11205/15526 [3:27:40<1:20:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11205/15526 [3:27:40<1:20:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11206/15526 [3:27:41<1:20:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11206/15526 [3:27:41<1:20:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11207/15526 [3:27:42<1:20:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11207/15526 [3:27:42<1:20:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11208/15526 [3:27:43<1:20:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11208/15526 [3:27:43<1:20:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11209/15526 [3:27:43<1:20:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11209/15526 [3:27:43<1:20:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11210/15526 [3:27:44<1:19:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11210/15526 [3:27:44<1:19:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11211/15526 [3:27:45<1:19:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11211/15526 [3:27:45<1:19:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11212/15526 [3:27:45<1:19:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11212/15526 [3:27:45<1:19:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11213/15526 [3:27:46<1:19:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11213/15526 [3:27:46<1:19:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11214/15526 [3:27:47<1:19:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11214/15526 [3:27:47<1:19:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11215/15526 [3:27:49<1:19:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11215/15526 [3:27:49<1:19:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11216/15526 [3:27:50<1:19:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11216/15526 [3:27:50<1:19:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11217/15526 [3:27:50<1:19:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11217/15526 [3:27:50<1:19:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11218/15526 [3:27:51<1:19:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11218/15526 [3:27:51<1:19:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11219/15526 [3:27:52<1:19:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11219/15526 [3:27:52<1:19:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11220/15526 [3:27:53<1:19:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11220/15526 [3:27:53<1:19:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11221/15526 [3:27:54<1:19:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11221/15526 [3:27:54<1:19:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11222/15526 [3:27:55<1:19:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11222/15526 [3:27:55<1:19:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11223/15526 [3:27:56<1:19:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11223/15526 [3:27:56<1:19:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11224/15526 [3:27:57<1:19:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11224/15526 [3:27:57<1:19:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11225/15526 [3:27:57<1:19:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11225/15526 [3:27:57<1:19:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11226/15526 [3:27:58<1:19:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11226/15526 [3:27:58<1:19:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11227/15526 [3:27:59<1:19:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11227/15526 [3:27:59<1:19:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11228/15526 [3:28:00<1:19:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11228/15526 [3:28:00<1:19:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11229/15526 [3:28:02<1:19:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11229/15526 [3:28:02<1:19:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11230/15526 [3:28:02<1:19:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11230/15526 [3:28:02<1:19:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11231/15526 [3:28:03<1:19:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11231/15526 [3:28:03<1:19:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11232/15526 [3:28:09<1:19:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11232/15526 [3:28:09<1:19:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11233/15526 [3:28:10<1:19:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11233/15526 [3:28:10<1:19:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11234/15526 [3:28:11<1:19:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11234/15526 [3:28:11<1:19:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11235/15526 [3:28:12<1:19:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11235/15526 [3:28:12<1:19:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11236/15526 [3:28:13<1:19:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11236/15526 [3:28:13<1:19:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11237/15526 [3:28:14<1:19:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11237/15526 [3:28:14<1:19:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11238/15526 [3:28:15<1:19:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11238/15526 [3:28:15<1:19:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11239/15526 [3:28:16<1:19:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11239/15526 [3:28:16<1:19:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11240/15526 [3:28:16<1:19:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11240/15526 [3:28:16<1:19:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11241/15526 [3:28:17<1:19:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11241/15526 [3:28:17<1:19:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11242/15526 [3:28:18<1:19:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11242/15526 [3:28:18<1:19:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11243/15526 [3:28:20<1:19:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11243/15526 [3:28:20<1:19:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11244/15526 [3:28:20<1:19:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11244/15526 [3:28:20<1:19:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11245/15526 [3:28:21<1:19:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11245/15526 [3:28:21<1:19:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11246/15526 [3:28:22<1:19:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11246/15526 [3:28:22<1:19:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11247/15526 [3:28:23<1:19:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11247/15526 [3:28:23<1:19:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11248/15526 [3:28:23<1:19:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11248/15526 [3:28:23<1:19:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11249/15526 [3:28:24<1:19:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11249/15526 [3:28:24<1:19:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11250/15526 [3:28:25<1:19:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11250/15526 [3:28:25<1:19:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11251/15526 [3:28:25<1:19:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11251/15526 [3:28:25<1:19:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11252/15526 [3:28:26<1:19:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11252/15526 [3:28:26<1:19:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11253/15526 [3:28:27<1:19:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11253/15526 [3:28:27<1:19:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11254/15526 [3:28:27<1:19:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11254/15526 [3:28:27<1:19:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11255/15526 [3:28:29<1:19:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11255/15526 [3:28:29<1:19:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 11256/15526 [3:28:30<1:19:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  72%|▋| 11256/15526 [3:28:30<1:19:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11257/15526 [3:28:31<1:19:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11257/15526 [3:28:31<1:19:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11258/15526 [3:28:32<1:19:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11258/15526 [3:28:32<1:19:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11259/15526 [3:28:33<1:19:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11259/15526 [3:28:33<1:19:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11260/15526 [3:28:34<1:19:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11260/15526 [3:28:34<1:19:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11261/15526 [3:28:35<1:19:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11261/15526 [3:28:35<1:19:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11262/15526 [3:28:36<1:18:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11262/15526 [3:28:36<1:18:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11263/15526 [3:28:37<1:18:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11263/15526 [3:28:37<1:18:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11264/15526 [3:28:44<1:18:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11264/15526 [3:28:44<1:18:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11265/15526 [3:28:44<1:18:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11265/15526 [3:28:44<1:18:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11266/15526 [3:28:45<1:18:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11266/15526 [3:28:45<1:18:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11267/15526 [3:28:46<1:18:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11267/15526 [3:28:46<1:18:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11268/15526 [3:28:47<1:18:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11268/15526 [3:28:47<1:18:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11269/15526 [3:28:49<1:18:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11269/15526 [3:28:49<1:18:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11270/15526 [3:28:49<1:18:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11270/15526 [3:28:49<1:18:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11271/15526 [3:28:50<1:18:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11271/15526 [3:28:50<1:18:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11272/15526 [3:28:51<1:18:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11272/15526 [3:28:51<1:18:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11273/15526 [3:28:52<1:18:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11273/15526 [3:28:52<1:18:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11274/15526 [3:28:52<1:18:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11274/15526 [3:28:52<1:18:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11275/15526 [3:28:53<1:18:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11275/15526 [3:28:53<1:18:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11276/15526 [3:28:54<1:18:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11276/15526 [3:28:54<1:18:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11277/15526 [3:28:54<1:18:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11277/15526 [3:28:54<1:18:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11278/15526 [3:28:55<1:18:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11278/15526 [3:28:55<1:18:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11279/15526 [3:28:56<1:18:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11279/15526 [3:28:56<1:18:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11280/15526 [3:28:57<1:18:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11280/15526 [3:28:57<1:18:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11281/15526 [3:28:58<1:18:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11281/15526 [3:28:58<1:18:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11282/15526 [3:28:58<1:18:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11282/15526 [3:28:58<1:18:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11283/15526 [3:28:59<1:18:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11283/15526 [3:28:59<1:18:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11284/15526 [3:29:00<1:18:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11284/15526 [3:29:00<1:18:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11285/15526 [3:29:01<1:18:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11285/15526 [3:29:01<1:18:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11286/15526 [3:29:01<1:18:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11286/15526 [3:29:01<1:18:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11287/15526 [3:29:02<1:18:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11287/15526 [3:29:02<1:18:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11288/15526 [3:29:03<1:18:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11288/15526 [3:29:03<1:18:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11289/15526 [3:29:03<1:18:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11289/15526 [3:29:03<1:18:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11290/15526 [3:29:05<1:18:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11290/15526 [3:29:05<1:18:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11291/15526 [3:29:05<1:18:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11291/15526 [3:29:05<1:18:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11292/15526 [3:29:06<1:18:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11292/15526 [3:29:06<1:18:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11293/15526 [3:29:07<1:18:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11293/15526 [3:29:07<1:18:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11294/15526 [3:29:08<1:18:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11294/15526 [3:29:08<1:18:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11295/15526 [3:29:09<1:18:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11295/15526 [3:29:09<1:18:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11296/15526 [3:29:17<1:18:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11296/15526 [3:29:17<1:18:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11297/15526 [3:29:18<1:18:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11297/15526 [3:29:18<1:18:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11298/15526 [3:29:19<1:18:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11298/15526 [3:29:19<1:18:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11299/15526 [3:29:19<1:18:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11299/15526 [3:29:19<1:18:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11300/15526 [3:29:21<1:18:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11300/15526 [3:29:21<1:18:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11301/15526 [3:29:21<1:18:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11301/15526 [3:29:21<1:18:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11302/15526 [3:29:22<1:18:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11302/15526 [3:29:22<1:18:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11303/15526 [3:29:23<1:18:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11303/15526 [3:29:23<1:18:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11304/15526 [3:29:23<1:18:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11304/15526 [3:29:23<1:18:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11305/15526 [3:29:24<1:18:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11305/15526 [3:29:24<1:18:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11306/15526 [3:29:25<1:18:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11306/15526 [3:29:25<1:18:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11307/15526 [3:29:26<1:18:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11307/15526 [3:29:26<1:18:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11308/15526 [3:29:27<1:18:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11308/15526 [3:29:27<1:18:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11309/15526 [3:29:28<1:18:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11309/15526 [3:29:28<1:18:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11310/15526 [3:29:28<1:18:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11310/15526 [3:29:28<1:18:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11311/15526 [3:29:29<1:18:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11311/15526 [3:29:29<1:18:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11312/15526 [3:29:30<1:18:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11312/15526 [3:29:30<1:18:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11313/15526 [3:29:31<1:18:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11313/15526 [3:29:31<1:18:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11314/15526 [3:29:31<1:18:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11314/15526 [3:29:31<1:18:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11315/15526 [3:29:32<1:17:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11315/15526 [3:29:32<1:17:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11316/15526 [3:29:33<1:17:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11316/15526 [3:29:33<1:17:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11317/15526 [3:29:34<1:17:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11317/15526 [3:29:34<1:17:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11318/15526 [3:29:35<1:17:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11318/15526 [3:29:35<1:17:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11319/15526 [3:29:36<1:17:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11319/15526 [3:29:36<1:17:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11320/15526 [3:29:37<1:17:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11320/15526 [3:29:37<1:17:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11321/15526 [3:29:38<1:17:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11321/15526 [3:29:38<1:17:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11322/15526 [3:29:38<1:17:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11322/15526 [3:29:38<1:17:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11323/15526 [3:29:40<1:17:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11323/15526 [3:29:40<1:17:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11324/15526 [3:29:40<1:17:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11324/15526 [3:29:40<1:17:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11325/15526 [3:29:41<1:17:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11325/15526 [3:29:41<1:17:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11326/15526 [3:29:42<1:17:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11326/15526 [3:29:42<1:17:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11327/15526 [3:29:42<1:17:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11327/15526 [3:29:42<1:17:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11328/15526 [3:29:51<1:17:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11328/15526 [3:29:51<1:17:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11329/15526 [3:29:52<1:17:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11329/15526 [3:29:52<1:17:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11330/15526 [3:29:53<1:17:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11330/15526 [3:29:53<1:17:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11331/15526 [3:29:53<1:17:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11331/15526 [3:29:53<1:17:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11332/15526 [3:29:54<1:17:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11332/15526 [3:29:54<1:17:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11333/15526 [3:29:55<1:17:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11333/15526 [3:29:55<1:17:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11334/15526 [3:29:56<1:17:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11334/15526 [3:29:56<1:17:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11335/15526 [3:29:56<1:17:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11335/15526 [3:29:56<1:17:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11336/15526 [3:29:57<1:17:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11336/15526 [3:29:57<1:17:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11337/15526 [3:29:58<1:17:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11337/15526 [3:29:58<1:17:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11338/15526 [3:29:59<1:17:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11338/15526 [3:29:59<1:17:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11339/15526 [3:30:00<1:17:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11339/15526 [3:30:00<1:17:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11340/15526 [3:30:00<1:17:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11340/15526 [3:30:00<1:17:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11341/15526 [3:30:01<1:17:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11341/15526 [3:30:01<1:17:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11342/15526 [3:30:02<1:17:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11342/15526 [3:30:02<1:17:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11343/15526 [3:30:03<1:17:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11343/15526 [3:30:03<1:17:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11344/15526 [3:30:04<1:17:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11344/15526 [3:30:04<1:17:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11345/15526 [3:30:05<1:17:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11345/15526 [3:30:05<1:17:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11346/15526 [3:30:06<1:17:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11346/15526 [3:30:06<1:17:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11347/15526 [3:30:07<1:17:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11347/15526 [3:30:07<1:17:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11348/15526 [3:30:08<1:17:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11348/15526 [3:30:08<1:17:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11349/15526 [3:30:09<1:17:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11349/15526 [3:30:09<1:17:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11350/15526 [3:30:10<1:17:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11350/15526 [3:30:10<1:17:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11351/15526 [3:30:11<1:17:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11351/15526 [3:30:11<1:17:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11352/15526 [3:30:12<1:17:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11352/15526 [3:30:12<1:17:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11353/15526 [3:30:13<1:17:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11353/15526 [3:30:13<1:17:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11354/15526 [3:30:13<1:17:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11354/15526 [3:30:13<1:17:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11355/15526 [3:30:14<1:17:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11355/15526 [3:30:14<1:17:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11356/15526 [3:30:15<1:17:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11356/15526 [3:30:15<1:17:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11357/15526 [3:30:15<1:17:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11357/15526 [3:30:15<1:17:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11358/15526 [3:30:16<1:17:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11358/15526 [3:30:16<1:17:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11359/15526 [3:30:17<1:17:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11359/15526 [3:30:17<1:17:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11360/15526 [3:30:26<1:17:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11360/15526 [3:30:26<1:17:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11361/15526 [3:30:26<1:17:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11361/15526 [3:30:26<1:17:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11362/15526 [3:30:27<1:17:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11362/15526 [3:30:27<1:17:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11363/15526 [3:30:28<1:17:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11363/15526 [3:30:28<1:17:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11364/15526 [3:30:29<1:17:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11364/15526 [3:30:29<1:17:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11365/15526 [3:30:30<1:17:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11365/15526 [3:30:30<1:17:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11366/15526 [3:30:31<1:17:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11366/15526 [3:30:31<1:17:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11367/15526 [3:30:32<1:17:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11367/15526 [3:30:32<1:17:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11368/15526 [3:30:32<1:17:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11368/15526 [3:30:32<1:17:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11369/15526 [3:30:33<1:16:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11369/15526 [3:30:33<1:16:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11370/15526 [3:30:34<1:16:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11370/15526 [3:30:34<1:16:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11371/15526 [3:30:34<1:16:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11371/15526 [3:30:34<1:16:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11372/15526 [3:30:36<1:16:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11372/15526 [3:30:36<1:16:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11373/15526 [3:30:37<1:16:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11373/15526 [3:30:37<1:16:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11374/15526 [3:30:38<1:16:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11374/15526 [3:30:38<1:16:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11375/15526 [3:30:39<1:16:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11375/15526 [3:30:39<1:16:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11376/15526 [3:30:39<1:16:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11376/15526 [3:30:39<1:16:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11377/15526 [3:30:40<1:16:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11377/15526 [3:30:40<1:16:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11378/15526 [3:30:41<1:16:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11378/15526 [3:30:41<1:16:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11379/15526 [3:30:41<1:16:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11379/15526 [3:30:41<1:16:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11380/15526 [3:30:43<1:16:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11380/15526 [3:30:43<1:16:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11381/15526 [3:30:44<1:16:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11381/15526 [3:30:44<1:16:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11382/15526 [3:30:45<1:16:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11382/15526 [3:30:45<1:16:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11383/15526 [3:30:46<1:16:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11383/15526 [3:30:46<1:16:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11384/15526 [3:30:47<1:16:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11384/15526 [3:30:47<1:16:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11385/15526 [3:30:48<1:16:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11385/15526 [3:30:48<1:16:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11386/15526 [3:30:49<1:16:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11386/15526 [3:30:49<1:16:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11387/15526 [3:30:51<1:16:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11387/15526 [3:30:51<1:16:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11388/15526 [3:30:51<1:16:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11388/15526 [3:30:51<1:16:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11389/15526 [3:30:52<1:16:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11389/15526 [3:30:52<1:16:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11390/15526 [3:30:53<1:16:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11390/15526 [3:30:53<1:16:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11391/15526 [3:30:54<1:16:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11391/15526 [3:30:54<1:16:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11392/15526 [3:31:00<1:16:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11392/15526 [3:31:00<1:16:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11393/15526 [3:31:01<1:16:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11393/15526 [3:31:01<1:16:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11394/15526 [3:31:02<1:16:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11394/15526 [3:31:02<1:16:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11395/15526 [3:31:03<1:16:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11395/15526 [3:31:03<1:16:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11396/15526 [3:31:03<1:16:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11396/15526 [3:31:03<1:16:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11397/15526 [3:31:05<1:16:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11397/15526 [3:31:05<1:16:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11398/15526 [3:31:06<1:16:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11398/15526 [3:31:06<1:16:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11399/15526 [3:31:07<1:16:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11399/15526 [3:31:07<1:16:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11400/15526 [3:31:08<1:16:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11400/15526 [3:31:08<1:16:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11401/15526 [3:31:08<1:16:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11401/15526 [3:31:08<1:16:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11402/15526 [3:31:09<1:16:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11402/15526 [3:31:09<1:16:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11403/15526 [3:31:10<1:16:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11403/15526 [3:31:10<1:16:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11404/15526 [3:31:10<1:16:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11404/15526 [3:31:10<1:16:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11405/15526 [3:31:11<1:16:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11405/15526 [3:31:11<1:16:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11406/15526 [3:31:12<1:16:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11406/15526 [3:31:12<1:16:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11407/15526 [3:31:13<1:16:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11407/15526 [3:31:13<1:16:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11408/15526 [3:31:14<1:16:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11408/15526 [3:31:14<1:16:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11409/15526 [3:31:15<1:16:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11409/15526 [3:31:15<1:16:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11410/15526 [3:31:16<1:16:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11410/15526 [3:31:16<1:16:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 11411/15526 [3:31:17<1:16:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  73%|▋| 11411/15526 [3:31:17<1:16:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11412/15526 [3:31:18<1:16:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11412/15526 [3:31:18<1:16:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11413/15526 [3:31:19<1:16:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11413/15526 [3:31:19<1:16:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11414/15526 [3:31:20<1:16:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11414/15526 [3:31:20<1:16:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11415/15526 [3:31:21<1:16:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11415/15526 [3:31:21<1:16:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11416/15526 [3:31:22<1:16:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11416/15526 [3:31:22<1:16:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11417/15526 [3:31:23<1:16:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11417/15526 [3:31:23<1:16:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11418/15526 [3:31:25<1:16:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11418/15526 [3:31:25<1:16:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11419/15526 [3:31:25<1:16:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11419/15526 [3:31:25<1:16:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11420/15526 [3:31:26<1:16:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11420/15526 [3:31:26<1:16:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11421/15526 [3:31:27<1:16:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11421/15526 [3:31:27<1:16:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11422/15526 [3:31:28<1:15:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11422/15526 [3:31:28<1:15:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11423/15526 [3:31:29<1:15:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11423/15526 [3:31:29<1:15:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11424/15526 [3:31:35<1:15:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11424/15526 [3:31:35<1:15:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11425/15526 [3:31:36<1:15:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11425/15526 [3:31:36<1:15:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11426/15526 [3:31:37<1:15:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11426/15526 [3:31:37<1:15:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11427/15526 [3:31:38<1:15:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11427/15526 [3:31:38<1:15:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11428/15526 [3:31:39<1:15:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11428/15526 [3:31:39<1:15:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11429/15526 [3:31:40<1:15:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11429/15526 [3:31:40<1:15:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11430/15526 [3:31:41<1:15:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11430/15526 [3:31:41<1:15:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11431/15526 [3:31:42<1:15:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11431/15526 [3:31:42<1:15:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11432/15526 [3:31:43<1:15:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11432/15526 [3:31:43<1:15:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11433/15526 [3:31:44<1:15:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11433/15526 [3:31:44<1:15:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11434/15526 [3:31:45<1:15:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11434/15526 [3:31:45<1:15:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11435/15526 [3:31:46<1:15:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11435/15526 [3:31:46<1:15:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11436/15526 [3:31:46<1:15:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11436/15526 [3:31:46<1:15:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11437/15526 [3:31:47<1:15:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11437/15526 [3:31:47<1:15:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11438/15526 [3:31:48<1:15:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11438/15526 [3:31:48<1:15:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11439/15526 [3:31:49<1:15:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11439/15526 [3:31:49<1:15:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11440/15526 [3:31:50<1:15:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11440/15526 [3:31:50<1:15:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11441/15526 [3:31:50<1:15:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11441/15526 [3:31:50<1:15:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11442/15526 [3:31:52<1:15:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11442/15526 [3:31:52<1:15:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11443/15526 [3:31:52<1:15:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11443/15526 [3:31:52<1:15:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11444/15526 [3:31:53<1:15:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11444/15526 [3:31:53<1:15:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11445/15526 [3:31:54<1:15:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11445/15526 [3:31:54<1:15:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11446/15526 [3:31:55<1:15:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11446/15526 [3:31:55<1:15:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11447/15526 [3:31:55<1:15:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11447/15526 [3:31:55<1:15:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11448/15526 [3:31:57<1:15:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11448/15526 [3:31:57<1:15:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11449/15526 [3:31:57<1:15:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11449/15526 [3:31:57<1:15:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11450/15526 [3:31:58<1:15:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11450/15526 [3:31:58<1:15:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11451/15526 [3:31:59<1:15:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11451/15526 [3:31:59<1:15:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11452/15526 [3:32:00<1:15:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11452/15526 [3:32:00<1:15:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11453/15526 [3:32:01<1:15:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11453/15526 [3:32:01<1:15:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11454/15526 [3:32:02<1:15:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11454/15526 [3:32:02<1:15:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11455/15526 [3:32:03<1:15:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11455/15526 [3:32:03<1:15:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11456/15526 [3:32:09<1:15:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11456/15526 [3:32:09<1:15:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11457/15526 [3:32:10<1:15:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11457/15526 [3:32:10<1:15:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11458/15526 [3:32:10<1:15:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11458/15526 [3:32:10<1:15:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11459/15526 [3:32:11<1:15:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11459/15526 [3:32:11<1:15:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11460/15526 [3:32:12<1:15:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11460/15526 [3:32:12<1:15:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11461/15526 [3:32:13<1:15:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11461/15526 [3:32:13<1:15:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11462/15526 [3:32:14<1:15:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11462/15526 [3:32:14<1:15:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11463/15526 [3:32:14<1:15:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11463/15526 [3:32:14<1:15:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11464/15526 [3:32:16<1:15:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11464/15526 [3:32:16<1:15:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11465/15526 [3:32:16<1:15:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11465/15526 [3:32:16<1:15:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11466/15526 [3:32:17<1:15:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11466/15526 [3:32:17<1:15:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11467/15526 [3:32:18<1:15:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11467/15526 [3:32:18<1:15:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11468/15526 [3:32:18<1:15:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11468/15526 [3:32:18<1:15:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11469/15526 [3:32:20<1:15:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11469/15526 [3:32:20<1:15:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11470/15526 [3:32:20<1:15:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11470/15526 [3:32:20<1:15:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11471/15526 [3:32:21<1:15:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11471/15526 [3:32:21<1:15:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11472/15526 [3:32:22<1:15:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11472/15526 [3:32:22<1:15:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11473/15526 [3:32:23<1:15:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11473/15526 [3:32:23<1:15:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11474/15526 [3:32:23<1:15:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11474/15526 [3:32:23<1:15:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11475/15526 [3:32:25<1:14:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11475/15526 [3:32:25<1:14:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11476/15526 [3:32:25<1:14:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11476/15526 [3:32:25<1:14:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11477/15526 [3:32:26<1:14:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11477/15526 [3:32:26<1:14:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11478/15526 [3:32:27<1:14:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11478/15526 [3:32:27<1:14:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11479/15526 [3:32:27<1:14:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11479/15526 [3:32:27<1:14:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11480/15526 [3:32:28<1:14:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11480/15526 [3:32:28<1:14:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11481/15526 [3:32:29<1:14:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11481/15526 [3:32:29<1:14:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11482/15526 [3:32:30<1:14:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11482/15526 [3:32:30<1:14:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11483/15526 [3:32:31<1:14:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11483/15526 [3:32:31<1:14:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11484/15526 [3:32:32<1:14:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11484/15526 [3:32:32<1:14:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11485/15526 [3:32:34<1:14:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11485/15526 [3:32:34<1:14:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11486/15526 [3:32:35<1:14:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11486/15526 [3:32:35<1:14:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11487/15526 [3:32:36<1:14:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11487/15526 [3:32:36<1:14:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11488/15526 [3:32:42<1:14:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11488/15526 [3:32:42<1:14:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11489/15526 [3:32:43<1:14:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11489/15526 [3:32:43<1:14:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11490/15526 [3:32:44<1:14:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11490/15526 [3:32:44<1:14:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11491/15526 [3:32:45<1:14:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11491/15526 [3:32:45<1:14:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11492/15526 [3:32:46<1:14:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11492/15526 [3:32:46<1:14:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11493/15526 [3:32:47<1:14:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11493/15526 [3:32:47<1:14:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11494/15526 [3:32:47<1:14:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11494/15526 [3:32:47<1:14:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11495/15526 [3:32:48<1:14:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11495/15526 [3:32:48<1:14:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11496/15526 [3:32:49<1:14:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11496/15526 [3:32:49<1:14:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11497/15526 [3:32:50<1:14:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11497/15526 [3:32:50<1:14:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11498/15526 [3:32:51<1:14:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11498/15526 [3:32:51<1:14:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11499/15526 [3:32:51<1:14:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11499/15526 [3:32:51<1:14:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11500/15526 [3:32:53<1:14:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11500/15526 [3:32:53<1:14:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11501/15526 [3:32:53<1:14:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11501/15526 [3:32:53<1:14:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11502/15526 [3:32:54<1:14:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11502/15526 [3:32:54<1:14:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11503/15526 [3:32:55<1:14:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11503/15526 [3:32:55<1:14:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11504/15526 [3:32:55<1:14:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11504/15526 [3:32:55<1:14:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11505/15526 [3:32:56<1:14:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11505/15526 [3:32:56<1:14:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11506/15526 [3:32:57<1:14:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11506/15526 [3:32:57<1:14:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11507/15526 [3:32:58<1:14:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11507/15526 [3:32:58<1:14:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11508/15526 [3:32:58<1:14:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11508/15526 [3:32:58<1:14:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11509/15526 [3:33:00<1:14:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11509/15526 [3:33:00<1:14:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11510/15526 [3:33:00<1:14:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11510/15526 [3:33:00<1:14:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11511/15526 [3:33:02<1:14:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11511/15526 [3:33:02<1:14:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11512/15526 [3:33:03<1:14:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11512/15526 [3:33:03<1:14:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11513/15526 [3:33:03<1:14:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11513/15526 [3:33:03<1:14:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11514/15526 [3:33:05<1:14:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11514/15526 [3:33:05<1:14:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11515/15526 [3:33:05<1:14:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11515/15526 [3:33:05<1:14:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11516/15526 [3:33:06<1:14:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11516/15526 [3:33:06<1:14:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11517/15526 [3:33:07<1:14:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11517/15526 [3:33:07<1:14:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11518/15526 [3:33:07<1:14:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11518/15526 [3:33:07<1:14:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11519/15526 [3:33:08<1:14:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11519/15526 [3:33:08<1:14:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11520/15526 [3:33:16<1:14:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11520/15526 [3:33:16<1:14:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11521/15526 [3:33:17<1:14:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11521/15526 [3:33:17<1:14:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11522/15526 [3:33:18<1:14:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11522/15526 [3:33:18<1:14:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11523/15526 [3:33:19<1:14:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11523/15526 [3:33:19<1:14:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11524/15526 [3:33:19<1:14:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11524/15526 [3:33:19<1:14:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11525/15526 [3:33:20<1:14:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11525/15526 [3:33:20<1:14:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11526/15526 [3:33:21<1:14:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11526/15526 [3:33:21<1:14:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11527/15526 [3:33:21<1:14:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11527/15526 [3:33:21<1:14:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11528/15526 [3:33:22<1:14:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11528/15526 [3:33:22<1:14:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11529/15526 [3:33:23<1:13:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11529/15526 [3:33:23<1:13:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11530/15526 [3:33:24<1:13:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11530/15526 [3:33:24<1:13:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11531/15526 [3:33:25<1:13:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11531/15526 [3:33:25<1:13:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11532/15526 [3:33:25<1:13:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11532/15526 [3:33:25<1:13:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11533/15526 [3:33:26<1:13:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11533/15526 [3:33:26<1:13:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11534/15526 [3:33:27<1:13:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11534/15526 [3:33:27<1:13:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11535/15526 [3:33:28<1:13:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11535/15526 [3:33:28<1:13:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11536/15526 [3:33:29<1:13:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11536/15526 [3:33:29<1:13:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11537/15526 [3:33:29<1:13:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11537/15526 [3:33:29<1:13:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11538/15526 [3:33:30<1:13:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11538/15526 [3:33:30<1:13:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11539/15526 [3:33:31<1:13:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11539/15526 [3:33:31<1:13:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11540/15526 [3:33:32<1:13:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11540/15526 [3:33:32<1:13:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11541/15526 [3:33:33<1:13:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11541/15526 [3:33:33<1:13:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11542/15526 [3:33:33<1:13:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11542/15526 [3:33:33<1:13:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11543/15526 [3:33:35<1:13:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11543/15526 [3:33:35<1:13:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11544/15526 [3:33:35<1:13:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11544/15526 [3:33:35<1:13:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11545/15526 [3:33:36<1:13:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11545/15526 [3:33:36<1:13:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11546/15526 [3:33:37<1:13:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11546/15526 [3:33:37<1:13:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11547/15526 [3:33:38<1:13:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11547/15526 [3:33:38<1:13:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11548/15526 [3:33:39<1:13:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11548/15526 [3:33:39<1:13:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11549/15526 [3:33:39<1:13:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11549/15526 [3:33:39<1:13:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11550/15526 [3:33:40<1:13:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11550/15526 [3:33:40<1:13:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11551/15526 [3:33:41<1:13:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11551/15526 [3:33:41<1:13:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11552/15526 [3:33:51<1:13:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11552/15526 [3:33:51<1:13:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11553/15526 [3:33:52<1:13:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11553/15526 [3:33:52<1:13:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11554/15526 [3:33:53<1:13:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11554/15526 [3:33:53<1:13:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11555/15526 [3:33:54<1:13:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11555/15526 [3:33:54<1:13:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11556/15526 [3:33:55<1:13:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11556/15526 [3:33:55<1:13:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11557/15526 [3:33:55<1:13:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11557/15526 [3:33:55<1:13:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11558/15526 [3:33:56<1:13:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11558/15526 [3:33:56<1:13:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11559/15526 [3:33:57<1:13:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11559/15526 [3:33:57<1:13:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11560/15526 [3:33:58<1:13:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11560/15526 [3:33:58<1:13:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11561/15526 [3:33:59<1:13:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11561/15526 [3:33:59<1:13:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11562/15526 [3:34:00<1:13:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11562/15526 [3:34:00<1:13:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11563/15526 [3:34:01<1:13:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11563/15526 [3:34:01<1:13:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11564/15526 [3:34:02<1:13:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11564/15526 [3:34:02<1:13:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11565/15526 [3:34:02<1:13:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11565/15526 [3:34:02<1:13:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 11566/15526 [3:34:04<1:13:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  74%|▋| 11566/15526 [3:34:04<1:13:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11567/15526 [3:34:04<1:13:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11567/15526 [3:34:04<1:13:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11568/15526 [3:34:06<1:13:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11568/15526 [3:34:06<1:13:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11569/15526 [3:34:06<1:13:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11569/15526 [3:34:06<1:13:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11570/15526 [3:34:07<1:13:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11570/15526 [3:34:07<1:13:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11571/15526 [3:34:08<1:13:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11571/15526 [3:34:08<1:13:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11572/15526 [3:34:08<1:13:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11572/15526 [3:34:08<1:13:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11573/15526 [3:34:09<1:13:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11573/15526 [3:34:09<1:13:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11574/15526 [3:34:10<1:13:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11574/15526 [3:34:10<1:13:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11575/15526 [3:34:11<1:13:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11575/15526 [3:34:11<1:13:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11576/15526 [3:34:13<1:13:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11576/15526 [3:34:13<1:13:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11577/15526 [3:34:13<1:13:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11577/15526 [3:34:13<1:13:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11578/15526 [3:34:14<1:13:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11578/15526 [3:34:14<1:13:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11579/15526 [3:34:15<1:13:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11579/15526 [3:34:15<1:13:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11580/15526 [3:34:15<1:13:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11580/15526 [3:34:15<1:13:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11581/15526 [3:34:16<1:12:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11581/15526 [3:34:16<1:12:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11582/15526 [3:34:17<1:12:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11582/15526 [3:34:17<1:12:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11583/15526 [3:34:17<1:12:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11583/15526 [3:34:17<1:12:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11584/15526 [3:34:25<1:12:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11584/15526 [3:34:25<1:12:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11585/15526 [3:34:26<1:12:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11585/15526 [3:34:26<1:12:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11586/15526 [3:34:27<1:12:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11586/15526 [3:34:27<1:12:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11587/15526 [3:34:27<1:12:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11587/15526 [3:34:27<1:12:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11588/15526 [3:34:28<1:12:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11588/15526 [3:34:28<1:12:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11589/15526 [3:34:29<1:12:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11589/15526 [3:34:29<1:12:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11590/15526 [3:34:30<1:12:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11590/15526 [3:34:30<1:12:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11591/15526 [3:34:30<1:12:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11591/15526 [3:34:30<1:12:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11592/15526 [3:34:31<1:12:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11592/15526 [3:34:31<1:12:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11593/15526 [3:34:32<1:12:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11593/15526 [3:34:32<1:12:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11594/15526 [3:34:33<1:12:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11594/15526 [3:34:33<1:12:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11595/15526 [3:34:34<1:12:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11595/15526 [3:34:34<1:12:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11596/15526 [3:34:34<1:12:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11596/15526 [3:34:34<1:12:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11597/15526 [3:34:35<1:12:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11597/15526 [3:34:35<1:12:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11598/15526 [3:34:36<1:12:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11598/15526 [3:34:36<1:12:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11599/15526 [3:34:37<1:12:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11599/15526 [3:34:37<1:12:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11600/15526 [3:34:38<1:12:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11600/15526 [3:34:38<1:12:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11601/15526 [3:34:39<1:12:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11601/15526 [3:34:39<1:12:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11602/15526 [3:34:40<1:12:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11602/15526 [3:34:40<1:12:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11603/15526 [3:34:40<1:12:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11603/15526 [3:34:40<1:12:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11604/15526 [3:34:41<1:12:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11604/15526 [3:34:41<1:12:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11605/15526 [3:34:42<1:12:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11605/15526 [3:34:42<1:12:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11606/15526 [3:34:43<1:12:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11606/15526 [3:34:43<1:12:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11607/15526 [3:34:43<1:12:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11607/15526 [3:34:43<1:12:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11608/15526 [3:34:44<1:12:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11608/15526 [3:34:44<1:12:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11609/15526 [3:34:45<1:12:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11609/15526 [3:34:45<1:12:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11610/15526 [3:34:46<1:12:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11610/15526 [3:34:46<1:12:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11611/15526 [3:34:47<1:12:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11611/15526 [3:34:47<1:12:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11612/15526 [3:34:48<1:12:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11612/15526 [3:34:48<1:12:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11613/15526 [3:34:49<1:12:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11613/15526 [3:34:49<1:12:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11614/15526 [3:34:50<1:12:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11614/15526 [3:34:50<1:12:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11615/15526 [3:34:52<1:12:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11615/15526 [3:34:52<1:12:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11616/15526 [3:35:00<1:12:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11616/15526 [3:35:00<1:12:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11617/15526 [3:35:01<1:12:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11617/15526 [3:35:01<1:12:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11618/15526 [3:35:02<1:12:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11618/15526 [3:35:02<1:12:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11619/15526 [3:35:03<1:12:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11619/15526 [3:35:03<1:12:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11620/15526 [3:35:03<1:12:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11620/15526 [3:35:03<1:12:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11621/15526 [3:35:05<1:12:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11621/15526 [3:35:05<1:12:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11622/15526 [3:35:05<1:12:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11622/15526 [3:35:05<1:12:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11623/15526 [3:35:06<1:12:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11623/15526 [3:35:06<1:12:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11624/15526 [3:35:07<1:12:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11624/15526 [3:35:07<1:12:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11625/15526 [3:35:08<1:12:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11625/15526 [3:35:08<1:12:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11626/15526 [3:35:09<1:12:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11626/15526 [3:35:09<1:12:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11627/15526 [3:35:10<1:12:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11627/15526 [3:35:10<1:12:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11628/15526 [3:35:11<1:12:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11628/15526 [3:35:11<1:12:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11629/15526 [3:35:11<1:12:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11629/15526 [3:35:11<1:12:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11630/15526 [3:35:12<1:12:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11630/15526 [3:35:12<1:12:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11631/15526 [3:35:13<1:12:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11631/15526 [3:35:13<1:12:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11632/15526 [3:35:14<1:12:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11632/15526 [3:35:14<1:12:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11633/15526 [3:35:14<1:12:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11633/15526 [3:35:14<1:12:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11634/15526 [3:35:15<1:12:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11634/15526 [3:35:15<1:12:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11635/15526 [3:35:16<1:11:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11635/15526 [3:35:16<1:11:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11636/15526 [3:35:17<1:11:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11636/15526 [3:35:17<1:11:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11637/15526 [3:35:18<1:11:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11637/15526 [3:35:18<1:11:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11638/15526 [3:35:18<1:11:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11638/15526 [3:35:18<1:11:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11639/15526 [3:35:20<1:11:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11639/15526 [3:35:20<1:11:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11640/15526 [3:35:21<1:11:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11640/15526 [3:35:21<1:11:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11641/15526 [3:35:22<1:11:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11641/15526 [3:35:22<1:11:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11642/15526 [3:35:23<1:11:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11642/15526 [3:35:23<1:11:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11643/15526 [3:35:23<1:11:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11643/15526 [3:35:23<1:11:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 11644/15526 [3:35:24<1:11:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▋| 11644/15526 [3:35:24<1:11:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11645/15526 [3:35:25<1:11:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11645/15526 [3:35:25<1:11:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11646/15526 [3:35:26<1:11:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11646/15526 [3:35:26<1:11:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11647/15526 [3:35:27<1:11:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11647/15526 [3:35:27<1:11:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11648/15526 [3:35:35<1:11:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11648/15526 [3:35:35<1:11:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11649/15526 [3:35:36<1:11:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11649/15526 [3:35:36<1:11:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11650/15526 [3:35:37<1:11:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11650/15526 [3:35:37<1:11:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11651/15526 [3:35:38<1:11:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11651/15526 [3:35:38<1:11:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11652/15526 [3:35:39<1:11:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11652/15526 [3:35:39<1:11:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11653/15526 [3:35:40<1:11:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11653/15526 [3:35:40<1:11:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11654/15526 [3:35:41<1:11:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11654/15526 [3:35:41<1:11:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11655/15526 [3:35:42<1:11:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11655/15526 [3:35:42<1:11:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11656/15526 [3:35:43<1:11:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11656/15526 [3:35:43<1:11:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11657/15526 [3:35:43<1:11:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11657/15526 [3:35:43<1:11:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11658/15526 [3:35:44<1:11:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11658/15526 [3:35:44<1:11:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11659/15526 [3:35:45<1:11:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11659/15526 [3:35:45<1:11:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11660/15526 [3:35:46<1:11:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11660/15526 [3:35:46<1:11:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11661/15526 [3:35:47<1:11:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11661/15526 [3:35:47<1:11:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11662/15526 [3:35:47<1:11:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11662/15526 [3:35:47<1:11:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11663/15526 [3:35:48<1:11:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11663/15526 [3:35:48<1:11:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11664/15526 [3:35:49<1:11:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11664/15526 [3:35:49<1:11:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11665/15526 [3:35:49<1:11:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11665/15526 [3:35:49<1:11:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11666/15526 [3:35:50<1:11:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11666/15526 [3:35:50<1:11:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11667/15526 [3:35:50<1:11:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11667/15526 [3:35:51<1:11:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11668/15526 [3:35:51<1:11:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11668/15526 [3:35:51<1:11:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11669/15526 [3:35:52<1:11:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11669/15526 [3:35:52<1:11:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11670/15526 [3:35:53<1:11:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11670/15526 [3:35:53<1:11:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11671/15526 [3:35:54<1:11:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11671/15526 [3:35:54<1:11:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11672/15526 [3:35:54<1:11:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11672/15526 [3:35:54<1:11:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11673/15526 [3:35:55<1:11:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11673/15526 [3:35:55<1:11:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11674/15526 [3:35:56<1:11:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11674/15526 [3:35:56<1:11:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11675/15526 [3:35:57<1:11:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11675/15526 [3:35:57<1:11:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11676/15526 [3:35:58<1:11:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11676/15526 [3:35:58<1:11:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11677/15526 [3:35:59<1:11:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11677/15526 [3:35:59<1:11:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11678/15526 [3:36:00<1:11:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11678/15526 [3:36:00<1:11:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11679/15526 [3:36:01<1:11:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11679/15526 [3:36:01<1:11:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11680/15526 [3:36:09<1:11:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11680/15526 [3:36:09<1:11:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11681/15526 [3:36:10<1:11:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11681/15526 [3:36:10<1:11:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11682/15526 [3:36:10<1:11:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11682/15526 [3:36:11<1:11:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11683/15526 [3:36:11<1:11:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11683/15526 [3:36:11<1:11:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11684/15526 [3:36:12<1:11:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11684/15526 [3:36:12<1:11:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11685/15526 [3:36:13<1:11:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11685/15526 [3:36:13<1:11:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11686/15526 [3:36:14<1:11:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11686/15526 [3:36:14<1:11:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11687/15526 [3:36:15<1:11:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11687/15526 [3:36:15<1:11:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11688/15526 [3:36:16<1:11:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11688/15526 [3:36:16<1:11:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11689/15526 [3:36:17<1:10:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11689/15526 [3:36:17<1:10:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11690/15526 [3:36:18<1:10:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11690/15526 [3:36:18<1:10:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11691/15526 [3:36:19<1:10:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11691/15526 [3:36:19<1:10:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11692/15526 [3:36:20<1:10:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11692/15526 [3:36:20<1:10:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11693/15526 [3:36:22<1:10:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11693/15526 [3:36:22<1:10:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11694/15526 [3:36:22<1:10:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11694/15526 [3:36:22<1:10:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11695/15526 [3:36:24<1:10:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11695/15526 [3:36:24<1:10:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11696/15526 [3:36:24<1:10:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11696/15526 [3:36:24<1:10:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11697/15526 [3:36:25<1:10:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11697/15526 [3:36:25<1:10:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11698/15526 [3:36:26<1:10:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11698/15526 [3:36:26<1:10:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11699/15526 [3:36:27<1:10:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11699/15526 [3:36:27<1:10:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11700/15526 [3:36:27<1:10:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11700/15526 [3:36:27<1:10:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11701/15526 [3:36:29<1:10:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11701/15526 [3:36:29<1:10:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11702/15526 [3:36:30<1:10:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11702/15526 [3:36:30<1:10:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11703/15526 [3:36:31<1:10:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11703/15526 [3:36:31<1:10:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11704/15526 [3:36:32<1:10:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11704/15526 [3:36:32<1:10:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11705/15526 [3:36:32<1:10:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11705/15526 [3:36:32<1:10:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11706/15526 [3:36:33<1:10:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11706/15526 [3:36:33<1:10:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11707/15526 [3:36:34<1:10:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11707/15526 [3:36:34<1:10:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11708/15526 [3:36:34<1:10:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11708/15526 [3:36:34<1:10:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11709/15526 [3:36:36<1:10:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11709/15526 [3:36:36<1:10:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11710/15526 [3:36:37<1:10:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11710/15526 [3:36:37<1:10:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11711/15526 [3:36:37<1:10:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11711/15526 [3:36:37<1:10:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11712/15526 [3:36:44<1:10:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11712/15526 [3:36:44<1:10:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11713/15526 [3:36:45<1:10:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11713/15526 [3:36:45<1:10:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11714/15526 [3:36:46<1:10:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11714/15526 [3:36:46<1:10:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11715/15526 [3:36:46<1:10:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11715/15526 [3:36:46<1:10:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11716/15526 [3:36:48<1:10:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11716/15526 [3:36:48<1:10:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11717/15526 [3:36:49<1:10:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11717/15526 [3:36:49<1:10:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11718/15526 [3:36:50<1:10:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11718/15526 [3:36:50<1:10:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11719/15526 [3:36:51<1:10:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11719/15526 [3:36:51<1:10:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11720/15526 [3:36:52<1:10:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11720/15526 [3:36:52<1:10:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11721/15526 [3:36:53<1:10:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11721/15526 [3:36:53<1:10:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 11722/15526 [3:36:54<1:10:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  75%|▊| 11722/15526 [3:36:54<1:10:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11723/15526 [3:36:55<1:10:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11723/15526 [3:36:55<1:10:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11724/15526 [3:36:56<1:10:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11724/15526 [3:36:56<1:10:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11725/15526 [3:36:57<1:10:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11725/15526 [3:36:57<1:10:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11726/15526 [3:36:58<1:10:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11726/15526 [3:36:58<1:10:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11727/15526 [3:36:58<1:10:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11727/15526 [3:36:58<1:10:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11728/15526 [3:36:59<1:10:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11728/15526 [3:36:59<1:10:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11729/15526 [3:37:00<1:10:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11729/15526 [3:37:00<1:10:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11730/15526 [3:37:01<1:10:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11730/15526 [3:37:01<1:10:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11731/15526 [3:37:01<1:10:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11731/15526 [3:37:01<1:10:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11732/15526 [3:37:02<1:10:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11732/15526 [3:37:02<1:10:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11733/15526 [3:37:03<1:10:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11733/15526 [3:37:03<1:10:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11734/15526 [3:37:03<1:10:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11734/15526 [3:37:03<1:10:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11735/15526 [3:37:04<1:10:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11735/15526 [3:37:04<1:10:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11736/15526 [3:37:05<1:10:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11736/15526 [3:37:05<1:10:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11737/15526 [3:37:06<1:10:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11737/15526 [3:37:06<1:10:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11738/15526 [3:37:06<1:10:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11738/15526 [3:37:06<1:10:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11739/15526 [3:37:07<1:10:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11739/15526 [3:37:07<1:10:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11740/15526 [3:37:08<1:10:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11740/15526 [3:37:08<1:10:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11741/15526 [3:37:09<1:10:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11741/15526 [3:37:09<1:10:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11742/15526 [3:37:10<1:09:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11742/15526 [3:37:10<1:09:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11743/15526 [3:37:11<1:09:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11743/15526 [3:37:11<1:09:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11744/15526 [3:37:19<1:09:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11744/15526 [3:37:19<1:09:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11745/15526 [3:37:20<1:09:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11745/15526 [3:37:20<1:09:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11746/15526 [3:37:21<1:09:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11746/15526 [3:37:21<1:09:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11747/15526 [3:37:22<1:09:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11747/15526 [3:37:22<1:09:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11748/15526 [3:37:22<1:09:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11748/15526 [3:37:22<1:09:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11749/15526 [3:37:23<1:09:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11749/15526 [3:37:23<1:09:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11750/15526 [3:37:24<1:09:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11750/15526 [3:37:24<1:09:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11751/15526 [3:37:24<1:09:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11751/15526 [3:37:24<1:09:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11752/15526 [3:37:25<1:09:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11752/15526 [3:37:25<1:09:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11753/15526 [3:37:26<1:09:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11753/15526 [3:37:26<1:09:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11754/15526 [3:37:27<1:09:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11754/15526 [3:37:27<1:09:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11755/15526 [3:37:27<1:09:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11755/15526 [3:37:27<1:09:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11756/15526 [3:37:28<1:09:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11756/15526 [3:37:28<1:09:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11757/15526 [3:37:29<1:09:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11757/15526 [3:37:29<1:09:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11758/15526 [3:37:29<1:09:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11758/15526 [3:37:29<1:09:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11759/15526 [3:37:30<1:09:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11759/15526 [3:37:30<1:09:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11760/15526 [3:37:31<1:09:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11760/15526 [3:37:31<1:09:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11761/15526 [3:37:32<1:09:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11761/15526 [3:37:32<1:09:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11762/15526 [3:37:33<1:09:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11762/15526 [3:37:33<1:09:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11763/15526 [3:37:34<1:09:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11763/15526 [3:37:34<1:09:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11764/15526 [3:37:35<1:09:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11764/15526 [3:37:35<1:09:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11765/15526 [3:37:36<1:09:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11765/15526 [3:37:36<1:09:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11766/15526 [3:37:37<1:09:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11766/15526 [3:37:37<1:09:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11767/15526 [3:37:37<1:09:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11767/15526 [3:37:37<1:09:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11768/15526 [3:37:38<1:09:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11768/15526 [3:37:38<1:09:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11769/15526 [3:37:39<1:09:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11769/15526 [3:37:39<1:09:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11770/15526 [3:37:40<1:09:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11770/15526 [3:37:40<1:09:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11771/15526 [3:37:41<1:09:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11771/15526 [3:37:41<1:09:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11772/15526 [3:37:42<1:09:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11772/15526 [3:37:42<1:09:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11773/15526 [3:37:43<1:09:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11773/15526 [3:37:43<1:09:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11774/15526 [3:37:43<1:09:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11774/15526 [3:37:43<1:09:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11775/15526 [3:37:44<1:09:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11775/15526 [3:37:44<1:09:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11776/15526 [3:37:52<1:09:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11776/15526 [3:37:52<1:09:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11777/15526 [3:37:53<1:09:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11777/15526 [3:37:53<1:09:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11778/15526 [3:37:54<1:09:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11778/15526 [3:37:54<1:09:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11779/15526 [3:37:54<1:09:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11779/15526 [3:37:54<1:09:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11780/15526 [3:37:55<1:09:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11780/15526 [3:37:55<1:09:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11781/15526 [3:37:56<1:09:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11781/15526 [3:37:56<1:09:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11782/15526 [3:37:56<1:09:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11782/15526 [3:37:56<1:09:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11783/15526 [3:37:57<1:09:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11783/15526 [3:37:57<1:09:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11784/15526 [3:37:58<1:09:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11784/15526 [3:37:58<1:09:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11785/15526 [3:37:58<1:09:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11785/15526 [3:37:58<1:09:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11786/15526 [3:38:00<1:09:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11786/15526 [3:38:00<1:09:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|��| 11787/15526 [3:38:00<1:09:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11787/15526 [3:38:00<1:09:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11788/15526 [3:38:01<1:09:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11788/15526 [3:38:01<1:09:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11789/15526 [3:38:02<1:09:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11789/15526 [3:38:02<1:09:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11790/15526 [3:38:02<1:09:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11790/15526 [3:38:02<1:09:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11791/15526 [3:38:03<1:09:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11791/15526 [3:38:03<1:09:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11792/15526 [3:38:04<1:09:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11792/15526 [3:38:04<1:09:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11793/15526 [3:38:05<1:09:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11793/15526 [3:38:05<1:09:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11794/15526 [3:38:06<1:09:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11794/15526 [3:38:06<1:09:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11795/15526 [3:38:06<1:08:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11795/15526 [3:38:06<1:08:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11796/15526 [3:38:07<1:08:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11796/15526 [3:38:07<1:08:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11797/15526 [3:38:08<1:08:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11797/15526 [3:38:08<1:08:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11798/15526 [3:38:08<1:08:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11798/15526 [3:38:08<1:08:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11799/15526 [3:38:09<1:08:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11799/15526 [3:38:09<1:08:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11800/15526 [3:38:10<1:08:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11800/15526 [3:38:10<1:08:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11801/15526 [3:38:10<1:08:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11801/15526 [3:38:10<1:08:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11802/15526 [3:38:12<1:08:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11802/15526 [3:38:12<1:08:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11803/15526 [3:38:13<1:08:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11803/15526 [3:38:13<1:08:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11804/15526 [3:38:13<1:08:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11804/15526 [3:38:13<1:08:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11805/15526 [3:38:15<1:08:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11805/15526 [3:38:15<1:08:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11806/15526 [3:38:15<1:08:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11806/15526 [3:38:15<1:08:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11807/15526 [3:38:16<1:08:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11807/15526 [3:38:16<1:08:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11808/15526 [3:38:27<1:08:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11808/15526 [3:38:27<1:08:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11809/15526 [3:38:28<1:08:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11809/15526 [3:38:28<1:08:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11810/15526 [3:38:29<1:08:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11810/15526 [3:38:29<1:08:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11811/15526 [3:38:29<1:08:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11811/15526 [3:38:29<1:08:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11812/15526 [3:38:30<1:08:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11812/15526 [3:38:30<1:08:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11813/15526 [3:38:31<1:08:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11813/15526 [3:38:31<1:08:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11814/15526 [3:38:32<1:08:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11814/15526 [3:38:32<1:08:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11815/15526 [3:38:33<1:08:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11815/15526 [3:38:33<1:08:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11816/15526 [3:38:33<1:08:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11816/15526 [3:38:33<1:08:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11817/15526 [3:38:34<1:08:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11817/15526 [3:38:34<1:08:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11818/15526 [3:38:35<1:08:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11818/15526 [3:38:35<1:08:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11819/15526 [3:38:36<1:08:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11819/15526 [3:38:36<1:08:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11820/15526 [3:38:37<1:08:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11820/15526 [3:38:37<1:08:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11821/15526 [3:38:37<1:08:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11821/15526 [3:38:37<1:08:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11822/15526 [3:38:38<1:08:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11822/15526 [3:38:38<1:08:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11823/15526 [3:38:39<1:08:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11823/15526 [3:38:39<1:08:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11824/15526 [3:38:40<1:08:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11824/15526 [3:38:40<1:08:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11825/15526 [3:38:42<1:08:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11825/15526 [3:38:42<1:08:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11826/15526 [3:38:42<1:08:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11826/15526 [3:38:42<1:08:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11827/15526 [3:38:43<1:08:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11827/15526 [3:38:43<1:08:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11828/15526 [3:38:44<1:08:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11828/15526 [3:38:44<1:08:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11829/15526 [3:38:45<1:08:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11829/15526 [3:38:45<1:08:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11830/15526 [3:38:47<1:08:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11830/15526 [3:38:47<1:08:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11831/15526 [3:38:47<1:08:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11831/15526 [3:38:47<1:08:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11832/15526 [3:38:48<1:08:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11832/15526 [3:38:48<1:08:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11833/15526 [3:38:49<1:08:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11833/15526 [3:38:49<1:08:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11834/15526 [3:38:50<1:08:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11834/15526 [3:38:50<1:08:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11835/15526 [3:38:52<1:08:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11835/15526 [3:38:52<1:08:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11836/15526 [3:38:52<1:08:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11836/15526 [3:38:52<1:08:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11837/15526 [3:38:53<1:08:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11837/15526 [3:38:53<1:08:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11838/15526 [3:38:54<1:08:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11838/15526 [3:38:54<1:08:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11839/15526 [3:38:55<1:08:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11839/15526 [3:38:55<1:08:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11840/15526 [3:39:01<1:08:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11840/15526 [3:39:01<1:08:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11841/15526 [3:39:02<1:08:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11841/15526 [3:39:02<1:08:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11842/15526 [3:39:03<1:08:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11842/15526 [3:39:03<1:08:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11843/15526 [3:39:03<1:08:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11843/15526 [3:39:03<1:08:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11844/15526 [3:39:04<1:08:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11844/15526 [3:39:04<1:08:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11845/15526 [3:39:06<1:08:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11845/15526 [3:39:06<1:08:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11846/15526 [3:39:07<1:08:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11846/15526 [3:39:07<1:08:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11847/15526 [3:39:07<1:08:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11847/15526 [3:39:07<1:08:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11848/15526 [3:39:08<1:08:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11848/15526 [3:39:08<1:08:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11849/15526 [3:39:09<1:08:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11849/15526 [3:39:09<1:08:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11850/15526 [3:39:09<1:07:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11850/15526 [3:39:09<1:07:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11851/15526 [3:39:10<1:07:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11851/15526 [3:39:10<1:07:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11852/15526 [3:39:11<1:07:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11852/15526 [3:39:11<1:07:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11853/15526 [3:39:12<1:07:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11853/15526 [3:39:12<1:07:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11854/15526 [3:39:13<1:07:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11854/15526 [3:39:13<1:07:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11855/15526 [3:39:14<1:07:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11855/15526 [3:39:14<1:07:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11856/15526 [3:39:15<1:07:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11856/15526 [3:39:15<1:07:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11857/15526 [3:39:16<1:07:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11857/15526 [3:39:16<1:07:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11858/15526 [3:39:16<1:07:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11858/15526 [3:39:16<1:07:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11859/15526 [3:39:18<1:07:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11859/15526 [3:39:18<1:07:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11860/15526 [3:39:19<1:07:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11860/15526 [3:39:19<1:07:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11861/15526 [3:39:19<1:07:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11861/15526 [3:39:19<1:07:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11862/15526 [3:39:20<1:07:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11862/15526 [3:39:20<1:07:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11863/15526 [3:39:22<1:07:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11863/15526 [3:39:22<1:07:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11864/15526 [3:39:23<1:07:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11864/15526 [3:39:23<1:07:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11865/15526 [3:39:24<1:07:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11865/15526 [3:39:24<1:07:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11866/15526 [3:39:24<1:07:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11866/15526 [3:39:24<1:07:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11867/15526 [3:39:25<1:07:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11867/15526 [3:39:25<1:07:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11868/15526 [3:39:25<1:07:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11868/15526 [3:39:25<1:07:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11869/15526 [3:39:26<1:07:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11869/15526 [3:39:26<1:07:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11870/15526 [3:39:27<1:07:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11870/15526 [3:39:27<1:07:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11871/15526 [3:39:28<1:07:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11871/15526 [3:39:28<1:07:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11872/15526 [3:39:35<1:07:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11872/15526 [3:39:35<1:07:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11873/15526 [3:39:36<1:07:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11873/15526 [3:39:36<1:07:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11874/15526 [3:39:36<1:07:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11874/15526 [3:39:36<1:07:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11875/15526 [3:39:37<1:07:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11875/15526 [3:39:37<1:07:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11876/15526 [3:39:38<1:07:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11876/15526 [3:39:38<1:07:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 11877/15526 [3:39:38<1:07:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  76%|▊| 11877/15526 [3:39:38<1:07:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11878/15526 [3:39:39<1:07:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11878/15526 [3:39:39<1:07:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11879/15526 [3:39:40<1:07:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11879/15526 [3:39:40<1:07:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11880/15526 [3:39:41<1:07:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11880/15526 [3:39:41<1:07:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11881/15526 [3:39:42<1:07:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11881/15526 [3:39:42<1:07:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11882/15526 [3:39:43<1:07:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11882/15526 [3:39:43<1:07:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11883/15526 [3:39:43<1:07:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11883/15526 [3:39:43<1:07:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11884/15526 [3:39:44<1:07:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11884/15526 [3:39:44<1:07:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11885/15526 [3:39:45<1:07:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11885/15526 [3:39:45<1:07:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11886/15526 [3:39:45<1:07:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11886/15526 [3:39:45<1:07:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11887/15526 [3:39:46<1:07:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11887/15526 [3:39:46<1:07:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11888/15526 [3:39:47<1:07:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11888/15526 [3:39:47<1:07:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11889/15526 [3:39:47<1:07:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11889/15526 [3:39:47<1:07:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11890/15526 [3:39:48<1:07:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11890/15526 [3:39:48<1:07:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11891/15526 [3:39:49<1:07:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11891/15526 [3:39:49<1:07:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11892/15526 [3:39:50<1:07:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11892/15526 [3:39:50<1:07:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11893/15526 [3:39:51<1:07:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11893/15526 [3:39:51<1:07:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11894/15526 [3:39:52<1:07:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11894/15526 [3:39:52<1:07:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11895/15526 [3:39:53<1:07:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11895/15526 [3:39:53<1:07:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11896/15526 [3:39:53<1:07:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11896/15526 [3:39:53<1:07:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11897/15526 [3:39:54<1:07:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11897/15526 [3:39:54<1:07:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11898/15526 [3:39:55<1:07:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11898/15526 [3:39:55<1:07:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11899/15526 [3:39:55<1:07:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11899/15526 [3:39:55<1:07:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11900/15526 [3:39:56<1:07:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11900/15526 [3:39:56<1:07:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11901/15526 [3:39:58<1:07:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11901/15526 [3:39:58<1:07:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11902/15526 [3:39:58<1:06:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11902/15526 [3:39:58<1:06:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11903/15526 [3:39:59<1:06:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11903/15526 [3:39:59<1:06:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11904/15526 [3:40:08<1:06:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11904/15526 [3:40:08<1:06:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11905/15526 [3:40:09<1:06:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11905/15526 [3:40:09<1:06:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11906/15526 [3:40:09<1:06:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11906/15526 [3:40:09<1:06:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11907/15526 [3:40:10<1:06:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11907/15526 [3:40:10<1:06:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11908/15526 [3:40:11<1:06:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11908/15526 [3:40:11<1:06:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11909/15526 [3:40:11<1:06:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11909/15526 [3:40:11<1:06:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11910/15526 [3:40:12<1:06:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11910/15526 [3:40:12<1:06:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11911/15526 [3:40:13<1:06:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11911/15526 [3:40:13<1:06:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11912/15526 [3:40:13<1:06:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11912/15526 [3:40:13<1:06:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11913/15526 [3:40:15<1:06:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11913/15526 [3:40:15<1:06:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11914/15526 [3:40:16<1:06:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11914/15526 [3:40:16<1:06:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11915/15526 [3:40:16<1:06:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11915/15526 [3:40:16<1:06:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11916/15526 [3:40:17<1:06:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11916/15526 [3:40:17<1:06:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11917/15526 [3:40:18<1:06:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11917/15526 [3:40:18<1:06:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11918/15526 [3:40:18<1:06:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11918/15526 [3:40:18<1:06:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11919/15526 [3:40:20<1:06:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11919/15526 [3:40:20<1:06:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11920/15526 [3:40:20<1:06:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11920/15526 [3:40:20<1:06:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11921/15526 [3:40:21<1:06:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11921/15526 [3:40:21<1:06:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11922/15526 [3:40:22<1:06:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11922/15526 [3:40:22<1:06:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11923/15526 [3:40:23<1:06:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11923/15526 [3:40:23<1:06:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11924/15526 [3:40:24<1:06:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11924/15526 [3:40:24<1:06:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11925/15526 [3:40:25<1:06:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11925/15526 [3:40:25<1:06:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11926/15526 [3:40:25<1:06:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11926/15526 [3:40:25<1:06:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11927/15526 [3:40:26<1:06:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11927/15526 [3:40:26<1:06:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11928/15526 [3:40:27<1:06:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11928/15526 [3:40:27<1:06:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11929/15526 [3:40:28<1:06:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11929/15526 [3:40:28<1:06:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11930/15526 [3:40:29<1:06:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11930/15526 [3:40:29<1:06:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11931/15526 [3:40:30<1:06:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11931/15526 [3:40:30<1:06:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11932/15526 [3:40:31<1:06:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11932/15526 [3:40:31<1:06:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11933/15526 [3:40:32<1:06:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11933/15526 [3:40:32<1:06:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11934/15526 [3:40:33<1:06:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11934/15526 [3:40:33<1:06:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11935/15526 [3:40:34<1:06:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11935/15526 [3:40:34<1:06:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11936/15526 [3:40:43<1:06:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11936/15526 [3:40:43<1:06:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11937/15526 [3:40:44<1:06:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11937/15526 [3:40:44<1:06:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11938/15526 [3:40:45<1:06:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11938/15526 [3:40:45<1:06:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11939/15526 [3:40:46<1:06:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11939/15526 [3:40:46<1:06:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11940/15526 [3:40:47<1:06:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11940/15526 [3:40:47<1:06:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11941/15526 [3:40:47<1:06:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11941/15526 [3:40:47<1:06:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11942/15526 [3:40:48<1:06:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11942/15526 [3:40:48<1:06:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11943/15526 [3:40:49<1:06:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11943/15526 [3:40:49<1:06:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11944/15526 [3:40:50<1:06:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11944/15526 [3:40:50<1:06:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11945/15526 [3:40:50<1:06:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11945/15526 [3:40:50<1:06:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11946/15526 [3:40:51<1:06:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11946/15526 [3:40:51<1:06:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11947/15526 [3:40:52<1:06:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11947/15526 [3:40:52<1:06:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11948/15526 [3:40:52<1:06:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11948/15526 [3:40:52<1:06:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11949/15526 [3:40:53<1:06:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11949/15526 [3:40:53<1:06:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11950/15526 [3:40:54<1:06:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11950/15526 [3:40:54<1:06:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11951/15526 [3:40:55<1:06:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11951/15526 [3:40:55<1:06:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11952/15526 [3:40:55<1:06:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11952/15526 [3:40:55<1:06:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11953/15526 [3:40:57<1:06:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11953/15526 [3:40:57<1:06:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11954/15526 [3:40:57<1:06:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11954/15526 [3:40:57<1:06:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11955/15526 [3:40:59<1:06:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11955/15526 [3:40:59<1:06:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11956/15526 [3:41:00<1:05:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11956/15526 [3:41:00<1:05:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11957/15526 [3:41:01<1:05:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11957/15526 [3:41:01<1:05:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11958/15526 [3:41:02<1:05:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11958/15526 [3:41:02<1:05:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11959/15526 [3:41:02<1:05:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11959/15526 [3:41:02<1:05:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11960/15526 [3:41:03<1:05:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11960/15526 [3:41:03<1:05:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11961/15526 [3:41:04<1:05:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11961/15526 [3:41:04<1:05:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11962/15526 [3:41:05<1:05:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11962/15526 [3:41:05<1:05:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11963/15526 [3:41:06<1:05:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11963/15526 [3:41:06<1:05:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11964/15526 [3:41:07<1:05:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11964/15526 [3:41:07<1:05:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11965/15526 [3:41:08<1:05:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11965/15526 [3:41:08<1:05:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11966/15526 [3:41:09<1:05:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11966/15526 [3:41:09<1:05:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11967/15526 [3:41:09<1:05:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11967/15526 [3:41:09<1:05:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11968/15526 [3:41:17<1:05:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11968/15526 [3:41:17<1:05:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11969/15526 [3:41:18<1:05:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11969/15526 [3:41:18<1:05:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11970/15526 [3:41:18<1:05:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11970/15526 [3:41:18<1:05:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11971/15526 [3:41:19<1:05:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11971/15526 [3:41:19<1:05:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11972/15526 [3:41:20<1:05:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11972/15526 [3:41:20<1:05:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11973/15526 [3:41:20<1:05:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11973/15526 [3:41:20<1:05:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11974/15526 [3:41:22<1:05:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11974/15526 [3:41:22<1:05:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11975/15526 [3:41:22<1:05:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11975/15526 [3:41:22<1:05:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11976/15526 [3:41:23<1:05:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11976/15526 [3:41:23<1:05:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11977/15526 [3:41:24<1:05:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11977/15526 [3:41:24<1:05:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11978/15526 [3:41:24<1:05:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11978/15526 [3:41:24<1:05:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11979/15526 [3:41:25<1:05:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11979/15526 [3:41:25<1:05:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11980/15526 [3:41:26<1:05:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11980/15526 [3:41:26<1:05:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11981/15526 [3:41:26<1:05:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11981/15526 [3:41:26<1:05:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11982/15526 [3:41:27<1:05:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11982/15526 [3:41:27<1:05:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11983/15526 [3:41:28<1:05:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11983/15526 [3:41:28<1:05:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11984/15526 [3:41:29<1:05:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11984/15526 [3:41:29<1:05:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11985/15526 [3:41:30<1:05:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11985/15526 [3:41:30<1:05:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11986/15526 [3:41:31<1:05:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11986/15526 [3:41:31<1:05:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11987/15526 [3:41:32<1:05:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11987/15526 [3:41:32<1:05:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11988/15526 [3:41:33<1:05:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11988/15526 [3:41:33<1:05:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11989/15526 [3:41:33<1:05:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11989/15526 [3:41:33<1:05:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11990/15526 [3:41:34<1:05:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11990/15526 [3:41:34<1:05:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11991/15526 [3:41:35<1:05:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11991/15526 [3:41:35<1:05:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11992/15526 [3:41:35<1:05:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11992/15526 [3:41:35<1:05:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11993/15526 [3:41:36<1:05:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11993/15526 [3:41:36<1:05:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11994/15526 [3:41:37<1:05:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11994/15526 [3:41:37<1:05:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11995/15526 [3:41:38<1:05:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11995/15526 [3:41:38<1:05:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11996/15526 [3:41:39<1:05:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11996/15526 [3:41:39<1:05:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11997/15526 [3:41:40<1:05:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11997/15526 [3:41:40<1:05:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11998/15526 [3:41:41<1:05:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11998/15526 [3:41:41<1:05:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 11999/15526 [3:41:42<1:05:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 11999/15526 [3:41:42<1:05:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12000/15526 [3:41:50<1:05:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12000/15526 [3:41:50<1:05:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12001/15526 [3:42:15<1:05:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12001/15526 [3:42:15<1:05:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12002/15526 [3:42:16<1:05:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12002/15526 [3:42:16<1:05:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12003/15526 [3:42:17<1:05:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12003/15526 [3:42:17<1:05:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12004/15526 [3:42:18<1:05:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12004/15526 [3:42:18<1:05:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12005/15526 [3:42:19<1:05:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12005/15526 [3:42:19<1:05:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12006/15526 [3:42:20<1:05:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12006/15526 [3:42:20<1:05:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12007/15526 [3:42:21<1:05:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12007/15526 [3:42:21<1:05:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12008/15526 [3:42:21<1:05:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12008/15526 [3:42:21<1:05:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12009/15526 [3:42:22<1:05:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12009/15526 [3:42:22<1:05:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12010/15526 [3:42:23<1:05:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12010/15526 [3:42:23<1:05:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12011/15526 [3:42:24<1:05:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12011/15526 [3:42:24<1:05:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12012/15526 [3:42:25<1:05:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12012/15526 [3:42:25<1:05:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12013/15526 [3:42:26<1:05:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12013/15526 [3:42:26<1:05:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12014/15526 [3:42:27<1:05:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12014/15526 [3:42:27<1:05:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12015/15526 [3:42:28<1:05:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12015/15526 [3:42:28<1:05:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12016/15526 [3:42:29<1:04:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12016/15526 [3:42:29<1:04:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12017/15526 [3:42:29<1:04:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12017/15526 [3:42:29<1:04:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12018/15526 [3:42:30<1:04:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12018/15526 [3:42:30<1:04:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12019/15526 [3:42:31<1:04:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12019/15526 [3:42:31<1:04:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12020/15526 [3:42:32<1:04:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12020/15526 [3:42:32<1:04:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12021/15526 [3:42:33<1:04:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12021/15526 [3:42:33<1:04:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12022/15526 [3:42:34<1:04:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12022/15526 [3:42:34<1:04:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12023/15526 [3:42:35<1:04:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12023/15526 [3:42:35<1:04:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12024/15526 [3:42:36<1:04:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12024/15526 [3:42:36<1:04:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12025/15526 [3:42:36<1:04:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12025/15526 [3:42:36<1:04:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12026/15526 [3:42:37<1:04:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12026/15526 [3:42:37<1:04:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12027/15526 [3:42:38<1:04:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12027/15526 [3:42:38<1:04:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12028/15526 [3:42:39<1:04:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12028/15526 [3:42:39<1:04:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12029/15526 [3:42:40<1:04:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12029/15526 [3:42:40<1:04:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12030/15526 [3:42:41<1:04:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12030/15526 [3:42:41<1:04:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12031/15526 [3:42:42<1:04:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12031/15526 [3:42:42<1:04:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 12032/15526 [3:42:50<1:04:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  77%|▊| 12032/15526 [3:42:50<1:04:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12033/15526 [3:42:50<1:04:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12033/15526 [3:42:50<1:04:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12034/15526 [3:42:51<1:04:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12034/15526 [3:42:51<1:04:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12035/15526 [3:42:52<1:04:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12035/15526 [3:42:52<1:04:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12036/15526 [3:42:53<1:04:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12036/15526 [3:42:53<1:04:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12037/15526 [3:42:54<1:04:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12037/15526 [3:42:54<1:04:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12038/15526 [3:42:55<1:04:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12038/15526 [3:42:55<1:04:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12039/15526 [3:42:56<1:04:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12039/15526 [3:42:56<1:04:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12040/15526 [3:42:56<1:04:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12040/15526 [3:42:56<1:04:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12041/15526 [3:42:57<1:04:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12041/15526 [3:42:57<1:04:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12042/15526 [3:42:58<1:04:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12042/15526 [3:42:58<1:04:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12043/15526 [3:42:59<1:04:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12043/15526 [3:42:59<1:04:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12044/15526 [3:43:00<1:04:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12044/15526 [3:43:00<1:04:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12045/15526 [3:43:01<1:04:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12045/15526 [3:43:01<1:04:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12046/15526 [3:43:02<1:04:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12046/15526 [3:43:02<1:04:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12047/15526 [3:43:03<1:04:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12047/15526 [3:43:03<1:04:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12048/15526 [3:43:04<1:04:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12048/15526 [3:43:04<1:04:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12049/15526 [3:43:05<1:04:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12049/15526 [3:43:05<1:04:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12050/15526 [3:43:05<1:04:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12050/15526 [3:43:05<1:04:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12051/15526 [3:43:07<1:04:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12051/15526 [3:43:07<1:04:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12052/15526 [3:43:07<1:04:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12052/15526 [3:43:07<1:04:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12053/15526 [3:43:08<1:04:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12053/15526 [3:43:08<1:04:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12054/15526 [3:43:09<1:04:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12054/15526 [3:43:09<1:04:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12055/15526 [3:43:09<1:04:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12055/15526 [3:43:09<1:04:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12056/15526 [3:43:10<1:04:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12056/15526 [3:43:10<1:04:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12057/15526 [3:43:11<1:04:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12057/15526 [3:43:11<1:04:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12058/15526 [3:43:12<1:04:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12058/15526 [3:43:12<1:04:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12059/15526 [3:43:14<1:04:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12059/15526 [3:43:14<1:04:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12060/15526 [3:43:14<1:04:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12060/15526 [3:43:14<1:04:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12061/15526 [3:43:16<1:04:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12061/15526 [3:43:16<1:04:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12062/15526 [3:43:16<1:04:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12062/15526 [3:43:16<1:04:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12063/15526 [3:43:17<1:04:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12063/15526 [3:43:17<1:04:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12064/15526 [3:43:25<1:04:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12064/15526 [3:43:25<1:04:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12065/15526 [3:43:25<1:04:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12065/15526 [3:43:25<1:04:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12066/15526 [3:43:26<1:04:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12066/15526 [3:43:26<1:04:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12067/15526 [3:43:27<1:04:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12067/15526 [3:43:27<1:04:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12068/15526 [3:43:28<1:04:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12068/15526 [3:43:28<1:04:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12069/15526 [3:43:29<1:04:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12069/15526 [3:43:29<1:04:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12070/15526 [3:43:30<1:03:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12070/15526 [3:43:30<1:03:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12071/15526 [3:43:31<1:03:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12071/15526 [3:43:31<1:03:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12072/15526 [3:43:32<1:03:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12072/15526 [3:43:32<1:03:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12073/15526 [3:43:33<1:03:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12073/15526 [3:43:33<1:03:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12074/15526 [3:43:33<1:03:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12074/15526 [3:43:33<1:03:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12075/15526 [3:43:34<1:03:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12075/15526 [3:43:34<1:03:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12076/15526 [3:43:35<1:03:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12076/15526 [3:43:35<1:03:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12077/15526 [3:43:36<1:03:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12077/15526 [3:43:36<1:03:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12078/15526 [3:43:37<1:03:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12078/15526 [3:43:37<1:03:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12079/15526 [3:43:37<1:03:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12079/15526 [3:43:37<1:03:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12080/15526 [3:43:39<1:03:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12080/15526 [3:43:39<1:03:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12081/15526 [3:43:39<1:03:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12081/15526 [3:43:39<1:03:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12082/15526 [3:43:40<1:03:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12082/15526 [3:43:40<1:03:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12083/15526 [3:43:41<1:03:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12083/15526 [3:43:41<1:03:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12084/15526 [3:43:42<1:03:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12084/15526 [3:43:42<1:03:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12085/15526 [3:43:43<1:03:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12085/15526 [3:43:43<1:03:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12086/15526 [3:43:43<1:03:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12086/15526 [3:43:43<1:03:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12087/15526 [3:43:44<1:03:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12087/15526 [3:43:44<1:03:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12088/15526 [3:43:45<1:03:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12088/15526 [3:43:45<1:03:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12089/15526 [3:43:46<1:03:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12089/15526 [3:43:46<1:03:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12090/15526 [3:43:47<1:03:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12090/15526 [3:43:47<1:03:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12091/15526 [3:43:48<1:03:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12091/15526 [3:43:48<1:03:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12092/15526 [3:43:49<1:03:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12092/15526 [3:43:49<1:03:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12093/15526 [3:43:50<1:03:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12093/15526 [3:43:50<1:03:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12094/15526 [3:43:51<1:03:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12094/15526 [3:43:51<1:03:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12095/15526 [3:43:52<1:03:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12095/15526 [3:43:52<1:03:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12096/15526 [3:43:59<1:03:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12096/15526 [3:43:59<1:03:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12097/15526 [3:44:00<1:03:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12097/15526 [3:44:00<1:03:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12098/15526 [3:44:01<1:03:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12098/15526 [3:44:01<1:03:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12099/15526 [3:44:02<1:03:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12099/15526 [3:44:02<1:03:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12100/15526 [3:44:02<1:03:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12100/15526 [3:44:02<1:03:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12101/15526 [3:44:03<1:03:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12101/15526 [3:44:03<1:03:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12102/15526 [3:44:04<1:03:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12102/15526 [3:44:04<1:03:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12103/15526 [3:44:05<1:03:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12103/15526 [3:44:05<1:03:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12104/15526 [3:44:06<1:03:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12104/15526 [3:44:06<1:03:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12105/15526 [3:44:06<1:03:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12105/15526 [3:44:06<1:03:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12106/15526 [3:44:07<1:03:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12106/15526 [3:44:07<1:03:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12107/15526 [3:44:08<1:03:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12107/15526 [3:44:08<1:03:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12108/15526 [3:44:08<1:03:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12108/15526 [3:44:08<1:03:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12109/15526 [3:44:09<1:03:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12109/15526 [3:44:09<1:03:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12110/15526 [3:44:10<1:03:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12110/15526 [3:44:10<1:03:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12111/15526 [3:44:11<1:03:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12111/15526 [3:44:11<1:03:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12112/15526 [3:44:11<1:03:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12112/15526 [3:44:11<1:03:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12113/15526 [3:44:12<1:03:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12113/15526 [3:44:12<1:03:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12114/15526 [3:44:13<1:03:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12114/15526 [3:44:13<1:03:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12115/15526 [3:44:14<1:03:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12115/15526 [3:44:14<1:03:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12116/15526 [3:44:15<1:03:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12116/15526 [3:44:15<1:03:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12117/15526 [3:44:16<1:03:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12117/15526 [3:44:16<1:03:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12118/15526 [3:44:17<1:03:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12118/15526 [3:44:17<1:03:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12119/15526 [3:44:18<1:03:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12119/15526 [3:44:18<1:03:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12120/15526 [3:44:19<1:03:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12120/15526 [3:44:19<1:03:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12121/15526 [3:44:19<1:03:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12121/15526 [3:44:19<1:03:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12122/15526 [3:44:21<1:03:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12122/15526 [3:44:21<1:03:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12123/15526 [3:44:21<1:02:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12123/15526 [3:44:21<1:02:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12124/15526 [3:44:22<1:02:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12124/15526 [3:44:22<1:02:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12125/15526 [3:44:23<1:02:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12125/15526 [3:44:23<1:02:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12126/15526 [3:44:24<1:02:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12126/15526 [3:44:24<1:02:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12127/15526 [3:44:25<1:02:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12127/15526 [3:44:25<1:02:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12128/15526 [3:44:35<1:02:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12128/15526 [3:44:35<1:02:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12129/15526 [3:44:36<1:02:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12129/15526 [3:44:36<1:02:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12130/15526 [3:44:37<1:02:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12130/15526 [3:44:37<1:02:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12131/15526 [3:44:37<1:02:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12131/15526 [3:44:37<1:02:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12132/15526 [3:44:38<1:02:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12132/15526 [3:44:38<1:02:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12133/15526 [3:44:39<1:02:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12133/15526 [3:44:39<1:02:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12134/15526 [3:44:40<1:02:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12134/15526 [3:44:40<1:02:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12135/15526 [3:44:40<1:02:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12135/15526 [3:44:40<1:02:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12136/15526 [3:44:41<1:02:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12136/15526 [3:44:41<1:02:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12137/15526 [3:44:42<1:02:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12137/15526 [3:44:42<1:02:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12138/15526 [3:44:43<1:02:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12138/15526 [3:44:43<1:02:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12139/15526 [3:44:43<1:02:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12139/15526 [3:44:43<1:02:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12140/15526 [3:44:45<1:02:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12140/15526 [3:44:45<1:02:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12141/15526 [3:44:45<1:02:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12141/15526 [3:44:45<1:02:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12142/15526 [3:44:47<1:02:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12142/15526 [3:44:47<1:02:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12143/15526 [3:44:47<1:02:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12143/15526 [3:44:47<1:02:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12144/15526 [3:44:48<1:02:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12144/15526 [3:44:48<1:02:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12145/15526 [3:44:49<1:02:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12145/15526 [3:44:49<1:02:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12146/15526 [3:44:49<1:02:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12146/15526 [3:44:49<1:02:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12147/15526 [3:44:50<1:02:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12147/15526 [3:44:50<1:02:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12148/15526 [3:44:51<1:02:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12148/15526 [3:44:51<1:02:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12149/15526 [3:44:51<1:02:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12149/15526 [3:44:51<1:02:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12150/15526 [3:44:52<1:02:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12150/15526 [3:44:52<1:02:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12151/15526 [3:44:53<1:02:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12151/15526 [3:44:53<1:02:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12152/15526 [3:44:53<1:02:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12152/15526 [3:44:53<1:02:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12153/15526 [3:44:54<1:02:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12153/15526 [3:44:54<1:02:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12154/15526 [3:44:55<1:02:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12154/15526 [3:44:55<1:02:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12155/15526 [3:44:56<1:02:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12155/15526 [3:44:56<1:02:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12156/15526 [3:44:56<1:02:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12156/15526 [3:44:56<1:02:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12157/15526 [3:44:58<1:02:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12157/15526 [3:44:58<1:02:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12158/15526 [3:44:58<1:02:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12158/15526 [3:44:58<1:02:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12159/15526 [3:44:59<1:02:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12159/15526 [3:44:59<1:02:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12160/15526 [3:45:09<1:02:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12160/15526 [3:45:09<1:02:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12161/15526 [3:45:10<1:02:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12161/15526 [3:45:10<1:02:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12162/15526 [3:45:11<1:02:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12162/15526 [3:45:11<1:02:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12163/15526 [3:45:12<1:02:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12163/15526 [3:45:12<1:02:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12164/15526 [3:45:13<1:02:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12164/15526 [3:45:13<1:02:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12165/15526 [3:45:14<1:02:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12165/15526 [3:45:14<1:02:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12166/15526 [3:45:15<1:02:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12166/15526 [3:45:15<1:02:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12167/15526 [3:45:16<1:02:11,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12167/15526 [3:45:16<1:02:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12168/15526 [3:45:16<1:02:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12168/15526 [3:45:16<1:02:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12169/15526 [3:45:18<1:02:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12169/15526 [3:45:18<1:02:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12170/15526 [3:45:18<1:02:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12170/15526 [3:45:18<1:02:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12171/15526 [3:45:19<1:02:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12171/15526 [3:45:19<1:02:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12172/15526 [3:45:20<1:02:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12172/15526 [3:45:20<1:02:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12173/15526 [3:45:20<1:02:04,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12173/15526 [3:45:20<1:02:04,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12174/15526 [3:45:21<1:02:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12174/15526 [3:45:21<1:02:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12175/15526 [3:45:22<1:02:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12175/15526 [3:45:22<1:02:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12176/15526 [3:45:23<1:02:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12176/15526 [3:45:23<1:02:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12177/15526 [3:45:23<1:01:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12177/15526 [3:45:23<1:01:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12178/15526 [3:45:24<1:01:58,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12178/15526 [3:45:24<1:01:58,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12179/15526 [3:45:25<1:01:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12179/15526 [3:45:25<1:01:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12180/15526 [3:45:26<1:01:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12180/15526 [3:45:26<1:01:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12181/15526 [3:45:27<1:01:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12181/15526 [3:45:27<1:01:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12182/15526 [3:45:27<1:01:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12182/15526 [3:45:27<1:01:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12183/15526 [3:45:28<1:01:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12183/15526 [3:45:28<1:01:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12184/15526 [3:45:29<1:01:51,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12184/15526 [3:45:29<1:01:51,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12185/15526 [3:45:29<1:01:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12185/15526 [3:45:29<1:01:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12186/15526 [3:45:30<1:01:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12186/15526 [3:45:30<1:01:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 12187/15526 [3:45:31<1:01:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  78%|▊| 12187/15526 [3:45:31<1:01:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12188/15526 [3:45:31<1:01:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12188/15526 [3:45:31<1:01:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12189/15526 [3:45:33<1:01:45,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12189/15526 [3:45:33<1:01:45,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12190/15526 [3:45:33<1:01:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12190/15526 [3:45:33<1:01:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12191/15526 [3:45:35<1:01:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12191/15526 [3:45:35<1:01:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12192/15526 [3:45:43<1:01:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12192/15526 [3:45:43<1:01:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12193/15526 [3:45:44<1:01:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12193/15526 [3:45:44<1:01:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12194/15526 [3:45:44<1:01:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12194/15526 [3:45:44<1:01:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12195/15526 [3:45:45<1:01:39,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12195/15526 [3:45:45<1:01:39,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12196/15526 [3:45:46<1:01:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12196/15526 [3:45:46<1:01:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12197/15526 [3:45:46<1:01:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12197/15526 [3:45:46<1:01:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12198/15526 [3:45:47<1:01:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12198/15526 [3:45:47<1:01:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12199/15526 [3:45:49<1:01:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12199/15526 [3:45:49<1:01:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12200/15526 [3:45:50<1:01:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12200/15526 [3:45:50<1:01:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12201/15526 [3:45:51<1:01:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12201/15526 [3:45:51<1:01:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12202/15526 [3:45:52<1:01:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12202/15526 [3:45:52<1:01:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12203/15526 [3:45:53<1:01:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12203/15526 [3:45:53<1:01:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12204/15526 [3:45:54<1:01:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12204/15526 [3:45:54<1:01:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12205/15526 [3:45:55<1:01:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12205/15526 [3:45:55<1:01:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12206/15526 [3:45:56<1:01:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12206/15526 [3:45:56<1:01:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12207/15526 [3:45:57<1:01:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12207/15526 [3:45:57<1:01:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12208/15526 [3:45:58<1:01:25,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12208/15526 [3:45:58<1:01:25,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12209/15526 [3:45:59<1:01:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12209/15526 [3:45:59<1:01:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12210/15526 [3:45:59<1:01:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12210/15526 [3:45:59<1:01:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12211/15526 [3:46:00<1:01:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12211/15526 [3:46:00<1:01:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12212/15526 [3:46:01<1:01:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12212/15526 [3:46:01<1:01:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12213/15526 [3:46:02<1:01:18,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12213/15526 [3:46:02<1:01:18,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12214/15526 [3:46:02<1:01:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12214/15526 [3:46:02<1:01:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12215/15526 [3:46:03<1:01:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12215/15526 [3:46:03<1:01:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12216/15526 [3:46:04<1:01:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12216/15526 [3:46:04<1:01:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12217/15526 [3:46:05<1:01:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12217/15526 [3:46:05<1:01:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12218/15526 [3:46:06<1:01:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12218/15526 [3:46:06<1:01:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12219/15526 [3:46:07<1:01:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12219/15526 [3:46:07<1:01:11,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12220/15526 [3:46:08<1:01:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12220/15526 [3:46:08<1:01:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12221/15526 [3:46:09<1:01:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12221/15526 [3:46:09<1:01:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12222/15526 [3:46:10<1:01:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12222/15526 [3:46:10<1:01:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12223/15526 [3:46:11<1:01:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12223/15526 [3:46:11<1:01:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12224/15526 [3:46:17<1:01:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12224/15526 [3:46:17<1:01:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12225/15526 [3:46:18<1:01:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12225/15526 [3:46:18<1:01:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12226/15526 [3:46:18<1:01:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12226/15526 [3:46:18<1:01:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12227/15526 [3:46:19<1:01:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12227/15526 [3:46:19<1:01:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12228/15526 [3:46:20<1:01:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12228/15526 [3:46:20<1:01:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12229/15526 [3:46:21<1:01:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12229/15526 [3:46:21<1:01:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12230/15526 [3:46:22<1:01:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12230/15526 [3:46:22<1:01:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12231/15526 [3:46:22<1:00:59,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12231/15526 [3:46:22<1:00:59,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12232/15526 [3:46:23<1:00:57,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12232/15526 [3:46:23<1:00:57,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12233/15526 [3:46:24<1:00:56,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12233/15526 [3:46:24<1:00:56,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12234/15526 [3:46:25<1:00:55,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12234/15526 [3:46:25<1:00:55,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12235/15526 [3:46:26<1:00:54,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12235/15526 [3:46:26<1:00:54,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12236/15526 [3:46:26<1:00:53,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12236/15526 [3:46:26<1:00:53,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12237/15526 [3:46:27<1:00:52,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12237/15526 [3:46:27<1:00:52,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12238/15526 [3:46:28<1:00:50,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12238/15526 [3:46:28<1:00:50,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12239/15526 [3:46:28<1:00:49,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12239/15526 [3:46:28<1:00:49,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12240/15526 [3:46:29<1:00:48,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12240/15526 [3:46:29<1:00:48,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12241/15526 [3:46:30<1:00:47,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12241/15526 [3:46:30<1:00:47,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12242/15526 [3:46:32<1:00:46,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12242/15526 [3:46:32<1:00:46,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12243/15526 [3:46:32<1:00:44,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12243/15526 [3:46:32<1:00:44,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12244/15526 [3:46:33<1:00:43,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12244/15526 [3:46:33<1:00:43,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12245/15526 [3:46:34<1:00:42,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12245/15526 [3:46:34<1:00:42,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12246/15526 [3:46:35<1:00:41,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12246/15526 [3:46:35<1:00:41,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12247/15526 [3:46:36<1:00:40,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12247/15526 [3:46:36<1:00:40,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12248/15526 [3:46:36<1:00:38,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12248/15526 [3:46:36<1:00:38,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12249/15526 [3:46:37<1:00:37,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12249/15526 [3:46:37<1:00:37,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12250/15526 [3:46:39<1:00:36,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12250/15526 [3:46:39<1:00:36,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12251/15526 [3:46:40<1:00:35,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12251/15526 [3:46:40<1:00:35,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12252/15526 [3:46:41<1:00:34,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12252/15526 [3:46:41<1:00:34,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12253/15526 [3:46:41<1:00:33,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12253/15526 [3:46:41<1:00:33,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12254/15526 [3:46:42<1:00:32,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12254/15526 [3:46:42<1:00:32,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12255/15526 [3:46:43<1:00:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12255/15526 [3:46:43<1:00:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12256/15526 [3:46:52<1:00:31,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12256/15526 [3:46:52<1:00:31,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12257/15526 [3:46:53<1:00:30,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12257/15526 [3:46:53<1:00:30,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12258/15526 [3:46:54<1:00:29,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12258/15526 [3:46:54<1:00:29,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12259/15526 [3:46:54<1:00:28,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12259/15526 [3:46:54<1:00:28,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12260/15526 [3:46:56<1:00:27,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12260/15526 [3:46:56<1:00:27,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12261/15526 [3:46:56<1:00:26,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12261/15526 [3:46:56<1:00:26,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12262/15526 [3:46:57<1:00:24,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12262/15526 [3:46:57<1:00:24,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12263/15526 [3:46:59<1:00:23,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12263/15526 [3:46:59<1:00:23,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12264/15526 [3:47:00<1:00:22,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12264/15526 [3:47:00<1:00:22,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12265/15526 [3:47:01<1:00:21,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12265/15526 [3:47:01<1:00:21,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12266/15526 [3:47:01<1:00:20,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12266/15526 [3:47:01<1:00:20,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12267/15526 [3:47:02<1:00:19,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12267/15526 [3:47:02<1:00:19,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12268/15526 [3:47:03<1:00:17,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12268/15526 [3:47:03<1:00:17,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12269/15526 [3:47:04<1:00:16,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12269/15526 [3:47:04<1:00:16,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12270/15526 [3:47:05<1:00:15,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12270/15526 [3:47:05<1:00:15,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12271/15526 [3:47:06<1:00:14,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12271/15526 [3:47:06<1:00:14,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12272/15526 [3:47:06<1:00:13,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12272/15526 [3:47:06<1:00:13,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12273/15526 [3:47:07<1:00:12,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12273/15526 [3:47:08<1:00:12,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12274/15526 [3:47:08<1:00:10,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12274/15526 [3:47:08<1:00:10,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12275/15526 [3:47:09<1:00:09,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12275/15526 [3:47:09<1:00:09,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12276/15526 [3:47:10<1:00:08,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12276/15526 [3:47:10<1:00:08,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12277/15526 [3:47:11<1:00:07,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12277/15526 [3:47:11<1:00:07,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12278/15526 [3:47:11<1:00:06,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12278/15526 [3:47:11<1:00:06,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12279/15526 [3:47:13<1:00:05,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12279/15526 [3:47:13<1:00:05,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12280/15526 [3:47:13<1:00:03,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12280/15526 [3:47:13<1:00:03,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12281/15526 [3:47:14<1:00:02,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12281/15526 [3:47:14<1:00:02,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12282/15526 [3:47:15<1:00:01,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12282/15526 [3:47:15<1:00:01,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12283/15526 [3:47:15<1:00:00,  1.11s/it, v_num=73vx, train/loss\r",
-      "Epoch 0:  79%|▊| 12283/15526 [3:47:15<1:00:00,  1.11s/it, v_num=73vx, train/loss"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12284/15526 [3:47:17<59:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12284/15526 [3:47:17<59:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12285/15526 [3:47:18<59:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12285/15526 [3:47:18<59:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12286/15526 [3:47:18<59:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12286/15526 [3:47:18<59:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12287/15526 [3:47:19<59:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12287/15526 [3:47:19<59:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12288/15526 [3:47:28<59:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12288/15526 [3:47:28<59:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12289/15526 [3:47:29<59:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12289/15526 [3:47:29<59:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12290/15526 [3:47:30<59:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12290/15526 [3:47:30<59:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12291/15526 [3:47:31<59:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12291/15526 [3:47:31<59:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12292/15526 [3:47:32<59:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12292/15526 [3:47:32<59:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12293/15526 [3:47:33<59:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12293/15526 [3:47:33<59:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12294/15526 [3:47:34<59:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12294/15526 [3:47:34<59:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12295/15526 [3:47:35<59:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12295/15526 [3:47:35<59:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12296/15526 [3:47:36<59:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12296/15526 [3:47:36<59:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12297/15526 [3:47:37<59:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12297/15526 [3:47:37<59:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12298/15526 [3:47:37<59:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12298/15526 [3:47:37<59:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12299/15526 [3:47:39<59:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12299/15526 [3:47:39<59:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12300/15526 [3:47:39<59:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12300/15526 [3:47:39<59:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12301/15526 [3:47:40<59:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12301/15526 [3:47:40<59:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12302/15526 [3:47:42<59:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12302/15526 [3:47:42<59:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12303/15526 [3:47:43<59:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12303/15526 [3:47:43<59:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12304/15526 [3:47:44<59:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12304/15526 [3:47:44<59:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12305/15526 [3:47:45<59:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12305/15526 [3:47:45<59:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12306/15526 [3:47:46<59:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12306/15526 [3:47:46<59:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12307/15526 [3:47:46<59:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12307/15526 [3:47:46<59:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12308/15526 [3:47:47<59:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12308/15526 [3:47:47<59:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12309/15526 [3:47:49<59:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12309/15526 [3:47:49<59:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12310/15526 [3:47:49<59:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12310/15526 [3:47:49<59:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12311/15526 [3:47:51<59:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12311/15526 [3:47:51<59:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12312/15526 [3:47:52<59:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12312/15526 [3:47:52<59:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12313/15526 [3:47:52<59:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12313/15526 [3:47:52<59:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12314/15526 [3:47:53<59:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12314/15526 [3:47:53<59:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12315/15526 [3:47:54<59:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12315/15526 [3:47:54<59:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12316/15526 [3:47:54<59:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12316/15526 [3:47:54<59:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12317/15526 [3:47:55<59:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12317/15526 [3:47:55<59:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12318/15526 [3:47:56<59:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12318/15526 [3:47:56<59:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12319/15526 [3:47:57<59:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12319/15526 [3:47:57<59:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12320/15526 [3:48:03<59:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12320/15526 [3:48:03<59:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12321/15526 [3:48:04<59:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12321/15526 [3:48:04<59:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12322/15526 [3:48:05<59:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12322/15526 [3:48:05<59:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12323/15526 [3:48:06<59:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12323/15526 [3:48:06<59:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12324/15526 [3:48:07<59:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12324/15526 [3:48:07<59:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12325/15526 [3:48:08<59:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12325/15526 [3:48:08<59:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12326/15526 [3:48:09<59:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12326/15526 [3:48:09<59:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12327/15526 [3:48:10<59:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12327/15526 [3:48:10<59:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12328/15526 [3:48:11<59:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12328/15526 [3:48:11<59:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12329/15526 [3:48:11<59:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12329/15526 [3:48:11<59:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12330/15526 [3:48:12<59:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12330/15526 [3:48:12<59:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12331/15526 [3:48:13<59:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12331/15526 [3:48:13<59:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12332/15526 [3:48:14<59:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12332/15526 [3:48:14<59:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12333/15526 [3:48:15<59:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12333/15526 [3:48:15<59:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12334/15526 [3:48:16<59:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12334/15526 [3:48:16<59:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12335/15526 [3:48:17<59:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12335/15526 [3:48:17<59:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12336/15526 [3:48:18<59:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12336/15526 [3:48:18<59:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12337/15526 [3:48:19<59:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12337/15526 [3:48:19<59:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12338/15526 [3:48:20<59:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12338/15526 [3:48:20<59:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12339/15526 [3:48:21<58:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12339/15526 [3:48:21<58:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12340/15526 [3:48:22<58:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12340/15526 [3:48:22<58:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12341/15526 [3:48:23<58:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12341/15526 [3:48:23<58:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12342/15526 [3:48:24<58:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12342/15526 [3:48:24<58:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 12343/15526 [3:48:25<58:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  79%|▊| 12343/15526 [3:48:25<58:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12344/15526 [3:48:26<58:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12344/15526 [3:48:26<58:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12345/15526 [3:48:28<58:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12345/15526 [3:48:28<58:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12346/15526 [3:48:28<58:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12346/15526 [3:48:28<58:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12347/15526 [3:48:29<58:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12347/15526 [3:48:29<58:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12348/15526 [3:48:30<58:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12348/15526 [3:48:30<58:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12349/15526 [3:48:31<58:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12349/15526 [3:48:31<58:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12350/15526 [3:48:32<58:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12350/15526 [3:48:32<58:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12351/15526 [3:48:33<58:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12351/15526 [3:48:33<58:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12352/15526 [3:48:39<58:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12352/15526 [3:48:39<58:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12353/15526 [3:48:39<58:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12353/15526 [3:48:39<58:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12354/15526 [3:48:40<58:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12354/15526 [3:48:40<58:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12355/15526 [3:48:41<58:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12355/15526 [3:48:41<58:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12356/15526 [3:48:42<58:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12356/15526 [3:48:42<58:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12357/15526 [3:48:43<58:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12357/15526 [3:48:43<58:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12358/15526 [3:48:44<58:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12358/15526 [3:48:44<58:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12359/15526 [3:48:45<58:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12359/15526 [3:48:45<58:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12360/15526 [3:48:46<58:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12360/15526 [3:48:46<58:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12361/15526 [3:48:47<58:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12361/15526 [3:48:47<58:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12362/15526 [3:48:48<58:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12362/15526 [3:48:48<58:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12363/15526 [3:48:49<58:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12363/15526 [3:48:49<58:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12364/15526 [3:48:49<58:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12364/15526 [3:48:49<58:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12365/15526 [3:48:50<58:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12365/15526 [3:48:50<58:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12366/15526 [3:48:51<58:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12366/15526 [3:48:51<58:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12367/15526 [3:48:52<58:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12367/15526 [3:48:52<58:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12368/15526 [3:48:53<58:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12368/15526 [3:48:53<58:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12369/15526 [3:48:53<58:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12369/15526 [3:48:53<58:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12370/15526 [3:48:54<58:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12370/15526 [3:48:54<58:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12371/15526 [3:48:55<58:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12371/15526 [3:48:55<58:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12372/15526 [3:48:56<58:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12372/15526 [3:48:56<58:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12373/15526 [3:48:57<58:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12373/15526 [3:48:57<58:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12374/15526 [3:48:57<58:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12374/15526 [3:48:57<58:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12375/15526 [3:48:58<58:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12375/15526 [3:48:58<58:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12376/15526 [3:48:59<58:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12376/15526 [3:48:59<58:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12377/15526 [3:49:00<58:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12377/15526 [3:49:00<58:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12378/15526 [3:49:00<58:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12378/15526 [3:49:00<58:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12379/15526 [3:49:01<58:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12379/15526 [3:49:01<58:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12380/15526 [3:49:02<58:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12380/15526 [3:49:02<58:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12381/15526 [3:49:02<58:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12381/15526 [3:49:02<58:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12382/15526 [3:49:03<58:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12382/15526 [3:49:03<58:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12383/15526 [3:49:04<58:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12383/15526 [3:49:04<58:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12384/15526 [3:49:14<58:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12384/15526 [3:49:14<58:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12385/15526 [3:49:14<58:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12385/15526 [3:49:14<58:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12386/15526 [3:49:15<58:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12386/15526 [3:49:15<58:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12387/15526 [3:49:16<58:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12387/15526 [3:49:16<58:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12388/15526 [3:49:17<58:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12388/15526 [3:49:17<58:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12389/15526 [3:49:18<58:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12389/15526 [3:49:18<58:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12390/15526 [3:49:19<58:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12390/15526 [3:49:19<58:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12391/15526 [3:49:20<58:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12391/15526 [3:49:20<58:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12392/15526 [3:49:21<58:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12392/15526 [3:49:21<58:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12393/15526 [3:49:23<57:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12393/15526 [3:49:23<57:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12394/15526 [3:49:23<57:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12394/15526 [3:49:23<57:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12395/15526 [3:49:24<57:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12395/15526 [3:49:24<57:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12396/15526 [3:49:25<57:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12396/15526 [3:49:25<57:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12397/15526 [3:49:26<57:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12397/15526 [3:49:26<57:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12398/15526 [3:49:27<57:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12398/15526 [3:49:27<57:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12399/15526 [3:49:28<57:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12399/15526 [3:49:28<57:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12400/15526 [3:49:29<57:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12400/15526 [3:49:29<57:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12401/15526 [3:49:30<57:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12401/15526 [3:49:30<57:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12402/15526 [3:49:30<57:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12402/15526 [3:49:30<57:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12403/15526 [3:49:31<57:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12403/15526 [3:49:31<57:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12404/15526 [3:49:32<57:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12404/15526 [3:49:32<57:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12405/15526 [3:49:33<57:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12405/15526 [3:49:33<57:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12406/15526 [3:49:34<57:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12406/15526 [3:49:34<57:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12407/15526 [3:49:35<57:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12407/15526 [3:49:35<57:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12408/15526 [3:49:36<57:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12408/15526 [3:49:36<57:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12409/15526 [3:49:36<57:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12409/15526 [3:49:36<57:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12410/15526 [3:49:38<57:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12410/15526 [3:49:38<57:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12411/15526 [3:49:38<57:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12411/15526 [3:49:38<57:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12412/15526 [3:49:39<57:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12412/15526 [3:49:39<57:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12413/15526 [3:49:40<57:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12413/15526 [3:49:40<57:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12414/15526 [3:49:41<57:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12414/15526 [3:49:41<57:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12415/15526 [3:49:41<57:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12415/15526 [3:49:41<57:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12416/15526 [3:49:48<57:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12416/15526 [3:49:48<57:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12417/15526 [3:49:49<57:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12417/15526 [3:49:49<57:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12418/15526 [3:49:50<57:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12418/15526 [3:49:50<57:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12419/15526 [3:49:51<57:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12419/15526 [3:49:51<57:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12420/15526 [3:49:52<57:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12420/15526 [3:49:52<57:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12421/15526 [3:49:52<57:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12421/15526 [3:49:52<57:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12422/15526 [3:49:53<57:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12422/15526 [3:49:53<57:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12423/15526 [3:49:54<57:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12423/15526 [3:49:54<57:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12424/15526 [3:49:55<57:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12424/15526 [3:49:55<57:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12425/15526 [3:49:56<57:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12425/15526 [3:49:56<57:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12426/15526 [3:49:57<57:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12426/15526 [3:49:57<57:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12427/15526 [3:49:58<57:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12427/15526 [3:49:58<57:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12428/15526 [3:49:58<57:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12428/15526 [3:49:58<57:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12429/15526 [3:49:59<57:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12429/15526 [3:49:59<57:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12430/15526 [3:50:00<57:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12430/15526 [3:50:00<57:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12431/15526 [3:50:00<57:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12431/15526 [3:50:00<57:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12432/15526 [3:50:01<57:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12432/15526 [3:50:01<57:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12433/15526 [3:50:02<57:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12433/15526 [3:50:02<57:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12434/15526 [3:50:03<57:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12434/15526 [3:50:03<57:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12435/15526 [3:50:05<57:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12435/15526 [3:50:05<57:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12436/15526 [3:50:05<57:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12436/15526 [3:50:05<57:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12437/15526 [3:50:06<57:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12437/15526 [3:50:06<57:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12438/15526 [3:50:07<57:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12438/15526 [3:50:07<57:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12439/15526 [3:50:07<57:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12439/15526 [3:50:07<57:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12440/15526 [3:50:08<57:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12440/15526 [3:50:08<57:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12441/15526 [3:50:09<57:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12441/15526 [3:50:09<57:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12442/15526 [3:50:10<57:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12442/15526 [3:50:10<57:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12443/15526 [3:50:10<57:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12443/15526 [3:50:10<57:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12444/15526 [3:50:11<57:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12444/15526 [3:50:11<57:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12445/15526 [3:50:12<56:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12445/15526 [3:50:12<56:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12446/15526 [3:50:12<56:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12446/15526 [3:50:12<56:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12447/15526 [3:50:13<56:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12447/15526 [3:50:13<56:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12448/15526 [3:50:23<56:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12448/15526 [3:50:23<56:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12449/15526 [3:50:23<56:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12449/15526 [3:50:23<56:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12450/15526 [3:50:24<56:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12450/15526 [3:50:24<56:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12451/15526 [3:50:25<56:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12451/15526 [3:50:25<56:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12452/15526 [3:50:26<56:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12452/15526 [3:50:26<56:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12453/15526 [3:50:26<56:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12453/15526 [3:50:26<56:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12454/15526 [3:50:27<56:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12454/15526 [3:50:27<56:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12455/15526 [3:50:28<56:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12455/15526 [3:50:28<56:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12456/15526 [3:50:30<56:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12456/15526 [3:50:30<56:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12457/15526 [3:50:31<56:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12457/15526 [3:50:31<56:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12458/15526 [3:50:31<56:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12458/15526 [3:50:31<56:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12459/15526 [3:50:32<56:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12459/15526 [3:50:32<56:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12460/15526 [3:50:33<56:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12460/15526 [3:50:33<56:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12461/15526 [3:50:34<56:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12461/15526 [3:50:34<56:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12462/15526 [3:50:35<56:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12462/15526 [3:50:35<56:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12463/15526 [3:50:36<56:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12463/15526 [3:50:36<56:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12464/15526 [3:50:36<56:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12464/15526 [3:50:36<56:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12465/15526 [3:50:37<56:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12465/15526 [3:50:37<56:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12466/15526 [3:50:38<56:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12466/15526 [3:50:38<56:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12467/15526 [3:50:39<56:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12467/15526 [3:50:39<56:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12468/15526 [3:50:40<56:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12468/15526 [3:50:40<56:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12469/15526 [3:50:41<56:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12469/15526 [3:50:41<56:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12470/15526 [3:50:43<56:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12470/15526 [3:50:43<56:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12471/15526 [3:50:44<56:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12471/15526 [3:50:44<56:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12472/15526 [3:50:44<56:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12472/15526 [3:50:44<56:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12473/15526 [3:50:45<56:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12473/15526 [3:50:45<56:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12474/15526 [3:50:46<56:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12474/15526 [3:50:46<56:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12475/15526 [3:50:47<56:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12475/15526 [3:50:47<56:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12476/15526 [3:50:48<56:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12476/15526 [3:50:48<56:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12477/15526 [3:50:48<56:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12477/15526 [3:50:48<56:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12478/15526 [3:50:49<56:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12478/15526 [3:50:49<56:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12479/15526 [3:50:50<56:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12479/15526 [3:50:50<56:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12480/15526 [3:50:57<56:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12480/15526 [3:50:57<56:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12481/15526 [3:50:59<56:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12481/15526 [3:50:59<56:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12482/15526 [3:51:00<56:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12482/15526 [3:51:00<56:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12483/15526 [3:51:01<56:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12483/15526 [3:51:01<56:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12484/15526 [3:51:02<56:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12484/15526 [3:51:02<56:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12485/15526 [3:51:03<56:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12485/15526 [3:51:03<56:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12486/15526 [3:51:03<56:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12486/15526 [3:51:03<56:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12487/15526 [3:51:04<56:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12487/15526 [3:51:04<56:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12488/15526 [3:51:05<56:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12488/15526 [3:51:05<56:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12489/15526 [3:51:07<56:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12489/15526 [3:51:07<56:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12490/15526 [3:51:07<56:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12490/15526 [3:51:07<56:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12491/15526 [3:51:08<56:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12491/15526 [3:51:08<56:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12492/15526 [3:51:09<56:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12492/15526 [3:51:09<56:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12493/15526 [3:51:10<56:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12493/15526 [3:51:10<56:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12494/15526 [3:51:10<56:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12494/15526 [3:51:10<56:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12495/15526 [3:51:12<56:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12495/15526 [3:51:12<56:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12496/15526 [3:51:12<56:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12496/15526 [3:51:12<56:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12497/15526 [3:51:14<56:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12497/15526 [3:51:14<56:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 12498/15526 [3:51:14<56:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  80%|▊| 12498/15526 [3:51:14<56:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12499/15526 [3:51:15<56:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12499/15526 [3:51:15<56:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12500/15526 [3:51:16<55:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12500/15526 [3:51:16<55:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12501/15526 [3:51:17<55:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12501/15526 [3:51:17<55:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12502/15526 [3:51:18<55:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12502/15526 [3:51:18<55:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12503/15526 [3:51:19<55:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12503/15526 [3:51:19<55:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12504/15526 [3:51:20<55:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12504/15526 [3:51:20<55:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12505/15526 [3:51:21<55:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12505/15526 [3:51:21<55:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12506/15526 [3:51:22<55:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12506/15526 [3:51:22<55:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12507/15526 [3:51:23<55:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12507/15526 [3:51:23<55:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12508/15526 [3:51:24<55:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12508/15526 [3:51:24<55:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12509/15526 [3:51:25<55:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12509/15526 [3:51:25<55:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12510/15526 [3:51:26<55:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12510/15526 [3:51:26<55:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12511/15526 [3:51:27<55:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12511/15526 [3:51:27<55:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12512/15526 [3:51:32<55:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12512/15526 [3:51:32<55:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12513/15526 [3:51:34<55:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12513/15526 [3:51:34<55:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12514/15526 [3:51:34<55:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12514/15526 [3:51:34<55:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12515/15526 [3:51:35<55:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12515/15526 [3:51:35<55:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12516/15526 [3:51:36<55:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12516/15526 [3:51:36<55:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12517/15526 [3:51:36<55:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12517/15526 [3:51:36<55:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12518/15526 [3:51:38<55:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12518/15526 [3:51:38<55:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12519/15526 [3:51:39<55:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12519/15526 [3:51:39<55:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12520/15526 [3:51:40<55:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12520/15526 [3:51:40<55:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12521/15526 [3:51:41<55:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12521/15526 [3:51:41<55:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12522/15526 [3:51:42<55:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12522/15526 [3:51:42<55:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12523/15526 [3:51:43<55:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12523/15526 [3:51:43<55:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12524/15526 [3:51:43<55:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12524/15526 [3:51:43<55:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12525/15526 [3:51:44<55:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12525/15526 [3:51:44<55:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12526/15526 [3:51:45<55:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12526/15526 [3:51:45<55:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|��| 12527/15526 [3:51:46<55:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12527/15526 [3:51:46<55:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12528/15526 [3:51:47<55:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12528/15526 [3:51:47<55:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12529/15526 [3:51:48<55:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12529/15526 [3:51:48<55:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12530/15526 [3:51:49<55:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12530/15526 [3:51:49<55:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12531/15526 [3:51:50<55:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12531/15526 [3:51:50<55:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12532/15526 [3:51:51<55:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12532/15526 [3:51:51<55:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12533/15526 [3:51:51<55:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12533/15526 [3:51:51<55:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12534/15526 [3:51:53<55:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12534/15526 [3:51:53<55:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12535/15526 [3:51:53<55:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12535/15526 [3:51:53<55:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12536/15526 [3:51:54<55:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12536/15526 [3:51:54<55:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12537/15526 [3:51:55<55:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12537/15526 [3:51:55<55:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12538/15526 [3:51:56<55:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12538/15526 [3:51:56<55:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12539/15526 [3:51:57<55:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12539/15526 [3:51:57<55:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12540/15526 [3:51:57<55:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12540/15526 [3:51:57<55:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12541/15526 [3:51:58<55:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12541/15526 [3:51:58<55:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12542/15526 [3:52:00<55:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12542/15526 [3:52:00<55:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12543/15526 [3:52:00<55:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12543/15526 [3:52:00<55:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12544/15526 [3:52:07<55:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12544/15526 [3:52:07<55:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12545/15526 [3:52:07<55:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12545/15526 [3:52:07<55:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12546/15526 [3:52:09<55:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12546/15526 [3:52:09<55:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12547/15526 [3:52:09<55:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12547/15526 [3:52:09<55:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12548/15526 [3:52:10<55:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12548/15526 [3:52:10<55:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12549/15526 [3:52:11<55:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12549/15526 [3:52:11<55:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12550/15526 [3:52:12<55:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12550/15526 [3:52:12<55:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12551/15526 [3:52:13<55:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12551/15526 [3:52:13<55:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12552/15526 [3:52:14<55:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12552/15526 [3:52:14<55:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12553/15526 [3:52:14<55:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12553/15526 [3:52:14<55:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12554/15526 [3:52:15<54:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12554/15526 [3:52:15<54:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12555/15526 [3:52:16<54:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12555/15526 [3:52:16<54:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12556/15526 [3:52:16<54:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12556/15526 [3:52:16<54:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12557/15526 [3:52:18<54:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12557/15526 [3:52:18<54:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12558/15526 [3:52:18<54:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12558/15526 [3:52:18<54:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12559/15526 [3:52:20<54:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12559/15526 [3:52:20<54:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12560/15526 [3:52:21<54:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12560/15526 [3:52:21<54:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12561/15526 [3:52:21<54:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12561/15526 [3:52:21<54:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12562/15526 [3:52:22<54:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12562/15526 [3:52:22<54:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12563/15526 [3:52:23<54:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12563/15526 [3:52:23<54:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12564/15526 [3:52:23<54:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12564/15526 [3:52:23<54:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12565/15526 [3:52:24<54:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12565/15526 [3:52:24<54:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12566/15526 [3:52:25<54:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12566/15526 [3:52:25<54:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12567/15526 [3:52:25<54:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12567/15526 [3:52:25<54:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12568/15526 [3:52:26<54:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12568/15526 [3:52:26<54:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12569/15526 [3:52:27<54:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12569/15526 [3:52:27<54:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12570/15526 [3:52:28<54:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12570/15526 [3:52:28<54:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12571/15526 [3:52:29<54:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12571/15526 [3:52:29<54:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12572/15526 [3:52:30<54:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12572/15526 [3:52:30<54:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12573/15526 [3:52:31<54:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12573/15526 [3:52:31<54:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12574/15526 [3:52:31<54:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12574/15526 [3:52:31<54:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12575/15526 [3:52:32<54:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12575/15526 [3:52:32<54:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12576/15526 [3:52:41<54:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12576/15526 [3:52:41<54:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12577/15526 [3:52:43<54:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12577/15526 [3:52:43<54:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12578/15526 [3:52:44<54:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12578/15526 [3:52:44<54:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12579/15526 [3:52:45<54:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12579/15526 [3:52:45<54:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12580/15526 [3:52:46<54:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12580/15526 [3:52:46<54:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12581/15526 [3:52:47<54:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12581/15526 [3:52:47<54:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12582/15526 [3:52:48<54:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12582/15526 [3:52:48<54:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12583/15526 [3:52:49<54:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12583/15526 [3:52:49<54:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12584/15526 [3:52:50<54:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12584/15526 [3:52:50<54:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12585/15526 [3:52:50<54:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12585/15526 [3:52:50<54:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12586/15526 [3:52:51<54:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12586/15526 [3:52:51<54:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12587/15526 [3:52:52<54:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12587/15526 [3:52:52<54:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12588/15526 [3:52:52<54:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12588/15526 [3:52:52<54:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12589/15526 [3:52:53<54:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12589/15526 [3:52:53<54:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12590/15526 [3:52:54<54:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12590/15526 [3:52:54<54:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12591/15526 [3:52:55<54:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12591/15526 [3:52:55<54:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12592/15526 [3:52:55<54:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12592/15526 [3:52:55<54:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12593/15526 [3:52:57<54:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12593/15526 [3:52:57<54:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12594/15526 [3:52:58<54:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12594/15526 [3:52:58<54:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12595/15526 [3:52:59<54:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12595/15526 [3:52:59<54:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12596/15526 [3:53:00<54:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12596/15526 [3:53:00<54:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12597/15526 [3:53:01<54:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12597/15526 [3:53:01<54:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12598/15526 [3:53:02<54:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12598/15526 [3:53:02<54:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12599/15526 [3:53:03<54:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12599/15526 [3:53:03<54:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12600/15526 [3:53:04<54:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12600/15526 [3:53:04<54:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12601/15526 [3:53:05<54:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12601/15526 [3:53:05<54:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12602/15526 [3:53:06<54:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12602/15526 [3:53:06<54:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12603/15526 [3:53:07<54:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12603/15526 [3:53:07<54:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12604/15526 [3:53:07<54:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12604/15526 [3:53:07<54:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12605/15526 [3:53:08<54:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12605/15526 [3:53:08<54:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12606/15526 [3:53:09<54:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12606/15526 [3:53:09<54:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12607/15526 [3:53:09<53:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12607/15526 [3:53:09<53:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12608/15526 [3:53:16<53:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12608/15526 [3:53:16<53:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12609/15526 [3:53:17<53:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12609/15526 [3:53:17<53:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12610/15526 [3:53:18<53:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12610/15526 [3:53:18<53:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12611/15526 [3:53:19<53:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12611/15526 [3:53:19<53:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12612/15526 [3:53:20<53:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12612/15526 [3:53:20<53:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12613/15526 [3:53:21<53:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12613/15526 [3:53:21<53:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12614/15526 [3:53:22<53:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12614/15526 [3:53:22<53:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12615/15526 [3:53:23<53:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12615/15526 [3:53:23<53:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12616/15526 [3:53:24<53:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12616/15526 [3:53:24<53:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12617/15526 [3:53:25<53:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12617/15526 [3:53:25<53:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12618/15526 [3:53:26<53:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12618/15526 [3:53:26<53:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12619/15526 [3:53:27<53:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12619/15526 [3:53:27<53:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12620/15526 [3:53:28<53:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12620/15526 [3:53:28<53:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12621/15526 [3:53:28<53:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12621/15526 [3:53:28<53:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12622/15526 [3:53:29<53:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12622/15526 [3:53:29<53:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12623/15526 [3:53:30<53:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12623/15526 [3:53:30<53:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12624/15526 [3:53:30<53:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12624/15526 [3:53:30<53:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12625/15526 [3:53:32<53:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12625/15526 [3:53:32<53:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12626/15526 [3:53:32<53:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12626/15526 [3:53:32<53:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12627/15526 [3:53:33<53:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12627/15526 [3:53:33<53:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12628/15526 [3:53:34<53:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12628/15526 [3:53:34<53:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12629/15526 [3:53:35<53:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12629/15526 [3:53:35<53:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12630/15526 [3:53:35<53:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12630/15526 [3:53:35<53:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12631/15526 [3:53:36<53:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12631/15526 [3:53:36<53:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12632/15526 [3:53:37<53:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12632/15526 [3:53:37<53:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12633/15526 [3:53:37<53:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12633/15526 [3:53:37<53:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12634/15526 [3:53:38<53:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12634/15526 [3:53:38<53:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12635/15526 [3:53:39<53:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12635/15526 [3:53:39<53:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12636/15526 [3:53:39<53:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12636/15526 [3:53:39<53:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12637/15526 [3:53:40<53:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12637/15526 [3:53:40<53:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12638/15526 [3:53:41<53:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12638/15526 [3:53:41<53:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12639/15526 [3:53:42<53:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12639/15526 [3:53:42<53:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12640/15526 [3:53:52<53:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12640/15526 [3:53:52<53:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12641/15526 [3:53:53<53:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12641/15526 [3:53:53<53:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12642/15526 [3:53:54<53:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12642/15526 [3:53:54<53:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12643/15526 [3:53:55<53:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12643/15526 [3:53:55<53:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12644/15526 [3:53:55<53:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12644/15526 [3:53:55<53:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12645/15526 [3:53:57<53:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12645/15526 [3:53:57<53:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12646/15526 [3:53:57<53:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12646/15526 [3:53:57<53:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12647/15526 [3:53:58<53:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12647/15526 [3:53:58<53:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12648/15526 [3:53:59<53:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12648/15526 [3:53:59<53:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12649/15526 [3:53:59<53:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12649/15526 [3:53:59<53:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12650/15526 [3:54:01<53:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12650/15526 [3:54:01<53:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12651/15526 [3:54:02<53:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12651/15526 [3:54:02<53:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12652/15526 [3:54:03<53:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12652/15526 [3:54:03<53:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 12653/15526 [3:54:04<53:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  81%|▊| 12653/15526 [3:54:04<53:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12654/15526 [3:54:05<53:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12654/15526 [3:54:05<53:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12655/15526 [3:54:06<53:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12655/15526 [3:54:06<53:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12656/15526 [3:54:07<53:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12656/15526 [3:54:07<53:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12657/15526 [3:54:07<53:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12657/15526 [3:54:07<53:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12658/15526 [3:54:08<53:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12658/15526 [3:54:08<53:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12659/15526 [3:54:09<53:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12659/15526 [3:54:09<53:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12660/15526 [3:54:09<53:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12660/15526 [3:54:09<53:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12661/15526 [3:54:10<52:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12661/15526 [3:54:10<52:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12662/15526 [3:54:11<52:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12662/15526 [3:54:11<52:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12663/15526 [3:54:12<52:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12663/15526 [3:54:12<52:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12664/15526 [3:54:13<52:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12664/15526 [3:54:13<52:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12665/15526 [3:54:14<52:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12665/15526 [3:54:14<52:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12666/15526 [3:54:14<52:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12666/15526 [3:54:14<52:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12667/15526 [3:54:16<52:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12667/15526 [3:54:16<52:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12668/15526 [3:54:16<52:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12668/15526 [3:54:16<52:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12669/15526 [3:54:18<52:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12669/15526 [3:54:18<52:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12670/15526 [3:54:19<52:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12670/15526 [3:54:19<52:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12671/15526 [3:54:19<52:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12671/15526 [3:54:19<52:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12672/15526 [3:54:27<52:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12672/15526 [3:54:27<52:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12673/15526 [3:54:28<52:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12673/15526 [3:54:28<52:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12674/15526 [3:54:29<52:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12674/15526 [3:54:29<52:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12675/15526 [3:54:30<52:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12675/15526 [3:54:30<52:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12676/15526 [3:54:31<52:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12676/15526 [3:54:31<52:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12677/15526 [3:54:32<52:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12677/15526 [3:54:32<52:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12678/15526 [3:54:32<52:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12678/15526 [3:54:32<52:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12679/15526 [3:54:33<52:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12679/15526 [3:54:33<52:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12680/15526 [3:54:34<52:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12680/15526 [3:54:34<52:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12681/15526 [3:54:35<52:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12681/15526 [3:54:35<52:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12682/15526 [3:54:36<52:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12682/15526 [3:54:36<52:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12683/15526 [3:54:36<52:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12683/15526 [3:54:36<52:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12684/15526 [3:54:37<52:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12684/15526 [3:54:37<52:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12685/15526 [3:54:38<52:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12685/15526 [3:54:38<52:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12686/15526 [3:54:38<52:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12686/15526 [3:54:38<52:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12687/15526 [3:54:39<52:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12687/15526 [3:54:39<52:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12688/15526 [3:54:40<52:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12688/15526 [3:54:40<52:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12689/15526 [3:54:40<52:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12689/15526 [3:54:40<52:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12690/15526 [3:54:41<52:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12690/15526 [3:54:41<52:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12691/15526 [3:54:43<52:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12691/15526 [3:54:43<52:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12692/15526 [3:54:44<52:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12692/15526 [3:54:44<52:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12693/15526 [3:54:44<52:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12693/15526 [3:54:44<52:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12694/15526 [3:54:46<52:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12694/15526 [3:54:46<52:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12695/15526 [3:54:46<52:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12695/15526 [3:54:46<52:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12696/15526 [3:54:47<52:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12696/15526 [3:54:47<52:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12697/15526 [3:54:48<52:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12697/15526 [3:54:48<52:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12698/15526 [3:54:49<52:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12698/15526 [3:54:49<52:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12699/15526 [3:54:50<52:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12699/15526 [3:54:50<52:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12700/15526 [3:54:51<52:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12700/15526 [3:54:51<52:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12701/15526 [3:54:52<52:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12701/15526 [3:54:52<52:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12702/15526 [3:54:53<52:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12702/15526 [3:54:53<52:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12703/15526 [3:54:54<52:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12703/15526 [3:54:54<52:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12704/15526 [3:55:01<52:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12704/15526 [3:55:01<52:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12705/15526 [3:55:02<52:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12705/15526 [3:55:02<52:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12706/15526 [3:55:03<52:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12706/15526 [3:55:03<52:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12707/15526 [3:55:04<52:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12707/15526 [3:55:04<52:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12708/15526 [3:55:05<52:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12708/15526 [3:55:05<52:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12709/15526 [3:55:06<52:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12709/15526 [3:55:06<52:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12710/15526 [3:55:06<52:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12710/15526 [3:55:06<52:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12711/15526 [3:55:07<52:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12711/15526 [3:55:07<52:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12712/15526 [3:55:08<52:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12712/15526 [3:55:08<52:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12713/15526 [3:55:09<52:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12713/15526 [3:55:09<52:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12714/15526 [3:55:10<52:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12714/15526 [3:55:10<52:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12715/15526 [3:55:11<51:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12715/15526 [3:55:11<51:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12716/15526 [3:55:11<51:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12716/15526 [3:55:11<51:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12717/15526 [3:55:12<51:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12717/15526 [3:55:12<51:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12718/15526 [3:55:13<51:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12718/15526 [3:55:13<51:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12719/15526 [3:55:14<51:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12719/15526 [3:55:14<51:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12720/15526 [3:55:15<51:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12720/15526 [3:55:15<51:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12721/15526 [3:55:15<51:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12721/15526 [3:55:15<51:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12722/15526 [3:55:16<51:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12722/15526 [3:55:16<51:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12723/15526 [3:55:17<51:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12723/15526 [3:55:17<51:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12724/15526 [3:55:18<51:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12724/15526 [3:55:18<51:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12725/15526 [3:55:19<51:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12725/15526 [3:55:19<51:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12726/15526 [3:55:20<51:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12726/15526 [3:55:20<51:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12727/15526 [3:55:20<51:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12727/15526 [3:55:20<51:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12728/15526 [3:55:21<51:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12728/15526 [3:55:21<51:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12729/15526 [3:55:22<51:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12729/15526 [3:55:22<51:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12730/15526 [3:55:23<51:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12730/15526 [3:55:23<51:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12731/15526 [3:55:24<51:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12731/15526 [3:55:24<51:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12732/15526 [3:55:25<51:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12732/15526 [3:55:25<51:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12733/15526 [3:55:25<51:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12733/15526 [3:55:25<51:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12734/15526 [3:55:26<51:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12734/15526 [3:55:26<51:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12735/15526 [3:55:27<51:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12735/15526 [3:55:27<51:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12736/15526 [3:55:35<51:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12736/15526 [3:55:35<51:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12737/15526 [3:55:36<51:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12737/15526 [3:55:36<51:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12738/15526 [3:55:37<51:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12738/15526 [3:55:37<51:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12739/15526 [3:55:37<51:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12739/15526 [3:55:37<51:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12740/15526 [3:55:38<51:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12740/15526 [3:55:38<51:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12741/15526 [3:55:39<51:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12741/15526 [3:55:39<51:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12742/15526 [3:55:39<51:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12742/15526 [3:55:39<51:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12743/15526 [3:55:40<51:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12743/15526 [3:55:40<51:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12744/15526 [3:55:41<51:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12744/15526 [3:55:41<51:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12745/15526 [3:55:41<51:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12745/15526 [3:55:41<51:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12746/15526 [3:55:42<51:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12746/15526 [3:55:42<51:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12747/15526 [3:55:43<51:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12747/15526 [3:55:43<51:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12748/15526 [3:55:43<51:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12748/15526 [3:55:43<51:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12749/15526 [3:55:44<51:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12749/15526 [3:55:44<51:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12750/15526 [3:55:45<51:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12750/15526 [3:55:45<51:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12751/15526 [3:55:46<51:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12751/15526 [3:55:46<51:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12752/15526 [3:55:47<51:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12752/15526 [3:55:47<51:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12753/15526 [3:55:48<51:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12753/15526 [3:55:48<51:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12754/15526 [3:55:49<51:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12754/15526 [3:55:49<51:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12755/15526 [3:55:49<51:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12755/15526 [3:55:49<51:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12756/15526 [3:55:50<51:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12756/15526 [3:55:50<51:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12757/15526 [3:55:51<51:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12757/15526 [3:55:51<51:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12758/15526 [3:55:52<51:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12758/15526 [3:55:52<51:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12759/15526 [3:55:53<51:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12759/15526 [3:55:53<51:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12760/15526 [3:55:54<51:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12760/15526 [3:55:54<51:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12761/15526 [3:55:55<51:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12761/15526 [3:55:55<51:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12762/15526 [3:55:55<51:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12762/15526 [3:55:55<51:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12763/15526 [3:55:57<51:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12763/15526 [3:55:57<51:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12764/15526 [3:55:57<51:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12764/15526 [3:55:57<51:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12765/15526 [3:55:58<51:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12765/15526 [3:55:58<51:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12766/15526 [3:55:59<51:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12766/15526 [3:55:59<51:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12767/15526 [3:56:00<51:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12767/15526 [3:56:00<51:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12768/15526 [3:56:10<51:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12768/15526 [3:56:10<51:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12769/15526 [3:56:11<50:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12769/15526 [3:56:11<50:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12770/15526 [3:56:12<50:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12770/15526 [3:56:12<50:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12771/15526 [3:56:12<50:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12771/15526 [3:56:12<50:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12772/15526 [3:56:14<50:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12772/15526 [3:56:14<50:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12773/15526 [3:56:14<50:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12773/15526 [3:56:14<50:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12774/15526 [3:56:15<50:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12774/15526 [3:56:15<50:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12775/15526 [3:56:16<50:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12775/15526 [3:56:16<50:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12776/15526 [3:56:17<50:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12776/15526 [3:56:17<50:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12777/15526 [3:56:18<50:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12777/15526 [3:56:18<50:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12778/15526 [3:56:19<50:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12778/15526 [3:56:19<50:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12779/15526 [3:56:19<50:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12779/15526 [3:56:19<50:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12780/15526 [3:56:20<50:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12780/15526 [3:56:20<50:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12781/15526 [3:56:21<50:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12781/15526 [3:56:21<50:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12782/15526 [3:56:22<50:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12782/15526 [3:56:22<50:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12783/15526 [3:56:23<50:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12783/15526 [3:56:23<50:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12784/15526 [3:56:23<50:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12784/15526 [3:56:23<50:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12785/15526 [3:56:24<50:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12785/15526 [3:56:24<50:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12786/15526 [3:56:25<50:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12786/15526 [3:56:25<50:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12787/15526 [3:56:26<50:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12787/15526 [3:56:26<50:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12788/15526 [3:56:27<50:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12788/15526 [3:56:27<50:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12789/15526 [3:56:28<50:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12789/15526 [3:56:28<50:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12790/15526 [3:56:29<50:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12790/15526 [3:56:29<50:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12791/15526 [3:56:29<50:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12791/15526 [3:56:29<50:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12792/15526 [3:56:30<50:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12792/15526 [3:56:30<50:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12793/15526 [3:56:31<50:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12793/15526 [3:56:31<50:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12794/15526 [3:56:33<50:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12794/15526 [3:56:33<50:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12795/15526 [3:56:33<50:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12795/15526 [3:56:33<50:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12796/15526 [3:56:34<50:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12796/15526 [3:56:34<50:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12797/15526 [3:56:35<50:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12797/15526 [3:56:35<50:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12798/15526 [3:56:36<50:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12798/15526 [3:56:36<50:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12799/15526 [3:56:37<50:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12799/15526 [3:56:37<50:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12800/15526 [3:56:45<50:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12800/15526 [3:56:45<50:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12801/15526 [3:57:08<50:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12801/15526 [3:57:08<50:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12802/15526 [3:57:09<50:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12802/15526 [3:57:09<50:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12803/15526 [3:57:10<50:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12803/15526 [3:57:10<50:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12804/15526 [3:57:11<50:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12804/15526 [3:57:11<50:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12805/15526 [3:57:11<50:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12805/15526 [3:57:11<50:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12806/15526 [3:57:12<50:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12806/15526 [3:57:12<50:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12807/15526 [3:57:13<50:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12807/15526 [3:57:13<50:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 12808/15526 [3:57:14<50:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  82%|▊| 12808/15526 [3:57:14<50:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12809/15526 [3:57:15<50:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12809/15526 [3:57:15<50:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12810/15526 [3:57:16<50:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12810/15526 [3:57:16<50:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12811/15526 [3:57:17<50:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12811/15526 [3:57:17<50:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12812/15526 [3:57:18<50:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12812/15526 [3:57:18<50:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12813/15526 [3:57:18<50:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12813/15526 [3:57:18<50:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12814/15526 [3:57:19<50:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12814/15526 [3:57:19<50:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12815/15526 [3:57:21<50:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12815/15526 [3:57:21<50:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12816/15526 [3:57:22<50:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12816/15526 [3:57:22<50:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12817/15526 [3:57:22<50:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12817/15526 [3:57:22<50:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12818/15526 [3:57:23<50:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12818/15526 [3:57:23<50:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12819/15526 [3:57:24<50:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12819/15526 [3:57:24<50:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12820/15526 [3:57:25<50:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12820/15526 [3:57:25<50:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12821/15526 [3:57:26<50:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12821/15526 [3:57:26<50:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12822/15526 [3:57:27<50:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12822/15526 [3:57:27<50:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12823/15526 [3:57:27<50:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12823/15526 [3:57:27<50:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12824/15526 [3:57:28<50:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12824/15526 [3:57:28<50:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12825/15526 [3:57:29<50:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12825/15526 [3:57:29<50:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12826/15526 [3:57:30<49:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12826/15526 [3:57:30<49:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12827/15526 [3:57:31<49:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12827/15526 [3:57:31<49:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12828/15526 [3:57:32<49:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12828/15526 [3:57:32<49:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12829/15526 [3:57:33<49:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12829/15526 [3:57:33<49:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12830/15526 [3:57:34<49:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12830/15526 [3:57:34<49:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12831/15526 [3:57:35<49:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12831/15526 [3:57:35<49:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12832/15526 [3:57:42<49:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12832/15526 [3:57:42<49:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12833/15526 [3:57:43<49:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12833/15526 [3:57:43<49:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12834/15526 [3:57:44<49:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12834/15526 [3:57:44<49:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12835/15526 [3:57:46<49:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12835/15526 [3:57:46<49:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12836/15526 [3:57:47<49:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12836/15526 [3:57:47<49:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12837/15526 [3:57:48<49:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12837/15526 [3:57:48<49:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12838/15526 [3:57:49<49:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12838/15526 [3:57:49<49:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12839/15526 [3:57:50<49:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12839/15526 [3:57:50<49:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12840/15526 [3:57:51<49:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12840/15526 [3:57:51<49:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12841/15526 [3:57:52<49:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12841/15526 [3:57:52<49:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12842/15526 [3:57:52<49:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12842/15526 [3:57:52<49:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12843/15526 [3:57:53<49:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12843/15526 [3:57:53<49:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12844/15526 [3:57:54<49:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12844/15526 [3:57:54<49:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12845/15526 [3:57:56<49:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12845/15526 [3:57:56<49:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12846/15526 [3:57:56<49:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12846/15526 [3:57:56<49:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12847/15526 [3:57:57<49:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12847/15526 [3:57:57<49:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12848/15526 [3:57:58<49:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12848/15526 [3:57:58<49:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12849/15526 [3:57:59<49:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12849/15526 [3:57:59<49:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12850/15526 [3:58:00<49:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12850/15526 [3:58:00<49:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12851/15526 [3:58:01<49:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12851/15526 [3:58:01<49:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12852/15526 [3:58:01<49:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12852/15526 [3:58:01<49:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12853/15526 [3:58:02<49:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12853/15526 [3:58:02<49:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12854/15526 [3:58:03<49:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12854/15526 [3:58:03<49:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12855/15526 [3:58:04<49:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12855/15526 [3:58:04<49:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12856/15526 [3:58:04<49:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12856/15526 [3:58:04<49:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12857/15526 [3:58:05<49:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12857/15526 [3:58:05<49:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12858/15526 [3:58:06<49:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12858/15526 [3:58:06<49:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12859/15526 [3:58:07<49:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12859/15526 [3:58:07<49:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12860/15526 [3:58:07<49:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12860/15526 [3:58:07<49:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12861/15526 [3:58:08<49:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12861/15526 [3:58:08<49:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12862/15526 [3:58:09<49:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12862/15526 [3:58:09<49:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12863/15526 [3:58:09<49:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12863/15526 [3:58:09<49:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12864/15526 [3:58:15<49:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12864/15526 [3:58:15<49:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12865/15526 [3:58:16<49:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12865/15526 [3:58:16<49:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12866/15526 [3:58:16<49:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12866/15526 [3:58:16<49:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12867/15526 [3:58:17<49:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12867/15526 [3:58:17<49:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12868/15526 [3:58:18<49:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12868/15526 [3:58:18<49:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12869/15526 [3:58:18<49:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12869/15526 [3:58:18<49:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12870/15526 [3:58:19<49:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12870/15526 [3:58:19<49:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12871/15526 [3:58:20<49:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12871/15526 [3:58:20<49:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12872/15526 [3:58:20<49:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12872/15526 [3:58:20<49:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12873/15526 [3:58:21<49:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12873/15526 [3:58:21<49:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12874/15526 [3:58:22<49:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12874/15526 [3:58:22<49:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12875/15526 [3:58:23<49:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12875/15526 [3:58:23<49:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12876/15526 [3:58:24<49:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12876/15526 [3:58:24<49:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12877/15526 [3:58:25<49:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12877/15526 [3:58:25<49:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12878/15526 [3:58:26<49:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12878/15526 [3:58:26<49:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12879/15526 [3:58:27<49:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12879/15526 [3:58:27<49:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12880/15526 [3:58:27<48:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12880/15526 [3:58:27<48:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12881/15526 [3:58:28<48:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12881/15526 [3:58:28<48:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12882/15526 [3:58:29<48:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12882/15526 [3:58:29<48:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12883/15526 [3:58:29<48:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12883/15526 [3:58:29<48:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12884/15526 [3:58:31<48:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12884/15526 [3:58:31<48:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12885/15526 [3:58:31<48:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12885/15526 [3:58:31<48:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12886/15526 [3:58:32<48:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12886/15526 [3:58:32<48:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12887/15526 [3:58:33<48:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12887/15526 [3:58:33<48:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12888/15526 [3:58:33<48:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12888/15526 [3:58:33<48:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12889/15526 [3:58:34<48:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12889/15526 [3:58:34<48:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12890/15526 [3:58:35<48:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12890/15526 [3:58:35<48:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12891/15526 [3:58:35<48:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12891/15526 [3:58:35<48:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12892/15526 [3:58:36<48:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12892/15526 [3:58:36<48:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12893/15526 [3:58:37<48:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12893/15526 [3:58:37<48:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12894/15526 [3:58:37<48:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12894/15526 [3:58:37<48:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12895/15526 [3:58:38<48:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12895/15526 [3:58:38<48:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12896/15526 [3:58:51<48:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12896/15526 [3:58:51<48:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12897/15526 [3:58:51<48:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12897/15526 [3:58:51<48:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12898/15526 [3:58:52<48:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12898/15526 [3:58:52<48:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12899/15526 [3:58:53<48:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12899/15526 [3:58:53<48:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12900/15526 [3:58:54<48:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12900/15526 [3:58:54<48:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12901/15526 [3:58:55<48:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12901/15526 [3:58:55<48:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12902/15526 [3:58:56<48:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12902/15526 [3:58:56<48:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12903/15526 [3:58:56<48:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12903/15526 [3:58:56<48:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12904/15526 [3:58:57<48:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12904/15526 [3:58:57<48:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12905/15526 [3:58:58<48:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12905/15526 [3:58:58<48:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12906/15526 [3:58:59<48:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12906/15526 [3:58:59<48:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12907/15526 [3:59:00<48:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12907/15526 [3:59:00<48:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12908/15526 [3:59:00<48:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12908/15526 [3:59:00<48:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12909/15526 [3:59:02<48:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12909/15526 [3:59:02<48:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12910/15526 [3:59:02<48:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12910/15526 [3:59:02<48:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12911/15526 [3:59:03<48:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12911/15526 [3:59:03<48:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12912/15526 [3:59:04<48:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12912/15526 [3:59:04<48:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12913/15526 [3:59:04<48:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12913/15526 [3:59:04<48:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12914/15526 [3:59:06<48:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12914/15526 [3:59:06<48:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12915/15526 [3:59:07<48:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12915/15526 [3:59:07<48:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12916/15526 [3:59:08<48:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12916/15526 [3:59:08<48:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12917/15526 [3:59:09<48:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12917/15526 [3:59:09<48:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12918/15526 [3:59:09<48:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12918/15526 [3:59:09<48:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12919/15526 [3:59:10<48:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12919/15526 [3:59:10<48:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12920/15526 [3:59:11<48:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12920/15526 [3:59:11<48:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12921/15526 [3:59:12<48:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12921/15526 [3:59:12<48:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12922/15526 [3:59:13<48:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12922/15526 [3:59:13<48:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12923/15526 [3:59:13<48:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12923/15526 [3:59:13<48:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12924/15526 [3:59:14<48:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12924/15526 [3:59:14<48:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12925/15526 [3:59:15<48:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12925/15526 [3:59:15<48:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12926/15526 [3:59:15<48:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12926/15526 [3:59:15<48:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12927/15526 [3:59:16<48:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12927/15526 [3:59:16<48:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12928/15526 [3:59:25<48:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12928/15526 [3:59:25<48:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12929/15526 [3:59:26<48:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12929/15526 [3:59:26<48:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12930/15526 [3:59:27<48:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12930/15526 [3:59:27<48:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12931/15526 [3:59:27<48:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12931/15526 [3:59:27<48:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12932/15526 [3:59:28<48:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12932/15526 [3:59:28<48:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12933/15526 [3:59:29<48:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12933/15526 [3:59:29<48:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12934/15526 [3:59:30<47:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12934/15526 [3:59:30<47:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12935/15526 [3:59:31<47:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12935/15526 [3:59:31<47:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12936/15526 [3:59:32<47:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12936/15526 [3:59:32<47:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12937/15526 [3:59:32<47:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12937/15526 [3:59:32<47:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12938/15526 [3:59:33<47:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12938/15526 [3:59:33<47:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12939/15526 [3:59:34<47:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12939/15526 [3:59:34<47:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12940/15526 [3:59:34<47:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12940/15526 [3:59:34<47:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12941/15526 [3:59:35<47:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12941/15526 [3:59:35<47:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12942/15526 [3:59:36<47:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12942/15526 [3:59:36<47:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12943/15526 [3:59:37<47:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12943/15526 [3:59:37<47:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12944/15526 [3:59:38<47:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12944/15526 [3:59:38<47:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12945/15526 [3:59:38<47:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12945/15526 [3:59:38<47:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12946/15526 [3:59:39<47:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12946/15526 [3:59:39<47:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12947/15526 [3:59:40<47:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12947/15526 [3:59:40<47:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12948/15526 [3:59:40<47:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12948/15526 [3:59:40<47:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12949/15526 [3:59:41<47:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12949/15526 [3:59:41<47:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12950/15526 [3:59:42<47:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12950/15526 [3:59:42<47:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12951/15526 [3:59:42<47:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12951/15526 [3:59:42<47:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12952/15526 [3:59:43<47:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12952/15526 [3:59:43<47:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12953/15526 [3:59:44<47:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12953/15526 [3:59:44<47:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12954/15526 [3:59:45<47:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12954/15526 [3:59:45<47:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12955/15526 [3:59:46<47:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12955/15526 [3:59:46<47:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12956/15526 [3:59:47<47:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12956/15526 [3:59:47<47:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12957/15526 [3:59:47<47:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12957/15526 [3:59:47<47:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12958/15526 [3:59:49<47:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12958/15526 [3:59:49<47:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12959/15526 [3:59:50<47:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12959/15526 [3:59:50<47:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12960/15526 [3:59:59<47:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12960/15526 [3:59:59<47:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12961/15526 [4:00:00<47:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12961/15526 [4:00:00<47:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12962/15526 [4:00:01<47:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12962/15526 [4:00:01<47:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12963/15526 [4:00:02<47:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12963/15526 [4:00:02<47:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 12964/15526 [4:00:03<47:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  83%|▊| 12964/15526 [4:00:03<47:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12965/15526 [4:00:04<47:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12965/15526 [4:00:04<47:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12966/15526 [4:00:05<47:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12966/15526 [4:00:05<47:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12967/15526 [4:00:06<47:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12967/15526 [4:00:06<47:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12968/15526 [4:00:07<47:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12968/15526 [4:00:07<47:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12969/15526 [4:00:08<47:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12969/15526 [4:00:08<47:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12970/15526 [4:00:09<47:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12970/15526 [4:00:09<47:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12971/15526 [4:00:10<47:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12971/15526 [4:00:10<47:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12972/15526 [4:00:11<47:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12972/15526 [4:00:11<47:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12973/15526 [4:00:12<47:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12973/15526 [4:00:12<47:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12974/15526 [4:00:13<47:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12974/15526 [4:00:13<47:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12975/15526 [4:00:14<47:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12975/15526 [4:00:14<47:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12976/15526 [4:00:15<47:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12976/15526 [4:00:15<47:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12977/15526 [4:00:16<47:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12977/15526 [4:00:16<47:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12978/15526 [4:00:17<47:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12978/15526 [4:00:17<47:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12979/15526 [4:00:18<47:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12979/15526 [4:00:18<47:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12980/15526 [4:00:19<47:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12980/15526 [4:00:19<47:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12981/15526 [4:00:20<47:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12981/15526 [4:00:20<47:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12982/15526 [4:00:20<47:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12982/15526 [4:00:20<47:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12983/15526 [4:00:21<47:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12983/15526 [4:00:21<47:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12984/15526 [4:00:23<47:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12984/15526 [4:00:23<47:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12985/15526 [4:00:23<47:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12985/15526 [4:00:23<47:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12986/15526 [4:00:24<47:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12986/15526 [4:00:24<47:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12987/15526 [4:00:25<47:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12987/15526 [4:00:25<47:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12988/15526 [4:00:25<46:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12988/15526 [4:00:25<46:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12989/15526 [4:00:26<46:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12989/15526 [4:00:26<46:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12990/15526 [4:00:27<46:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12990/15526 [4:00:27<46:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12991/15526 [4:00:28<46:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12991/15526 [4:00:28<46:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12992/15526 [4:00:34<46:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12992/15526 [4:00:34<46:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12993/15526 [4:00:35<46:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12993/15526 [4:00:35<46:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12994/15526 [4:00:36<46:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12994/15526 [4:00:36<46:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12995/15526 [4:00:37<46:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12995/15526 [4:00:37<46:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12996/15526 [4:00:38<46:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12996/15526 [4:00:38<46:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12997/15526 [4:00:39<46:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12997/15526 [4:00:39<46:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12998/15526 [4:00:39<46:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12998/15526 [4:00:39<46:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 12999/15526 [4:00:41<46:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 12999/15526 [4:00:41<46:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13000/15526 [4:00:41<46:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13000/15526 [4:00:41<46:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13001/15526 [4:00:42<46:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13001/15526 [4:00:42<46:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13002/15526 [4:00:43<46:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13002/15526 [4:00:43<46:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13003/15526 [4:00:43<46:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13003/15526 [4:00:43<46:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13004/15526 [4:00:44<46:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13004/15526 [4:00:44<46:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13005/15526 [4:00:45<46:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13005/15526 [4:00:45<46:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13006/15526 [4:00:46<46:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13006/15526 [4:00:46<46:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13007/15526 [4:00:46<46:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13007/15526 [4:00:46<46:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13008/15526 [4:00:47<46:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13008/15526 [4:00:47<46:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13009/15526 [4:00:48<46:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13009/15526 [4:00:48<46:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13010/15526 [4:00:48<46:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13010/15526 [4:00:48<46:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13011/15526 [4:00:50<46:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13011/15526 [4:00:50<46:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13012/15526 [4:00:50<46:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13012/15526 [4:00:50<46:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13013/15526 [4:00:51<46:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13013/15526 [4:00:51<46:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13014/15526 [4:00:52<46:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13014/15526 [4:00:52<46:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13015/15526 [4:00:53<46:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13015/15526 [4:00:53<46:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13016/15526 [4:00:55<46:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13016/15526 [4:00:55<46:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13017/15526 [4:00:55<46:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13017/15526 [4:00:55<46:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13018/15526 [4:00:56<46:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13018/15526 [4:00:56<46:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13019/15526 [4:00:57<46:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13019/15526 [4:00:57<46:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13020/15526 [4:00:58<46:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13020/15526 [4:00:58<46:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13021/15526 [4:00:59<46:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13021/15526 [4:00:59<46:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13022/15526 [4:01:00<46:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13022/15526 [4:01:00<46:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13023/15526 [4:01:01<46:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13023/15526 [4:01:01<46:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13024/15526 [4:01:10<46:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13024/15526 [4:01:10<46:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13025/15526 [4:01:11<46:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13025/15526 [4:01:11<46:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13026/15526 [4:01:12<46:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13026/15526 [4:01:12<46:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13027/15526 [4:01:13<46:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13027/15526 [4:01:13<46:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13028/15526 [4:01:14<46:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13028/15526 [4:01:14<46:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13029/15526 [4:01:15<46:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13029/15526 [4:01:15<46:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13030/15526 [4:01:16<46:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13030/15526 [4:01:16<46:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13031/15526 [4:01:17<46:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13031/15526 [4:01:17<46:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13032/15526 [4:01:18<46:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13032/15526 [4:01:18<46:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13033/15526 [4:01:19<46:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13033/15526 [4:01:19<46:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13034/15526 [4:01:20<46:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13034/15526 [4:01:20<46:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13035/15526 [4:01:21<46:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13035/15526 [4:01:21<46:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13036/15526 [4:01:23<46:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13036/15526 [4:01:23<46:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13037/15526 [4:01:23<46:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13037/15526 [4:01:23<46:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13038/15526 [4:01:24<46:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13038/15526 [4:01:24<46:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13039/15526 [4:01:25<46:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13039/15526 [4:01:25<46:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13040/15526 [4:01:26<46:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13040/15526 [4:01:26<46:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13041/15526 [4:01:26<46:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13041/15526 [4:01:26<46:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13042/15526 [4:01:27<45:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13042/15526 [4:01:27<45:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13043/15526 [4:01:28<45:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13043/15526 [4:01:28<45:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13044/15526 [4:01:29<45:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13044/15526 [4:01:29<45:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13045/15526 [4:01:30<45:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13045/15526 [4:01:30<45:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13046/15526 [4:01:30<45:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13046/15526 [4:01:30<45:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13047/15526 [4:01:32<45:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13047/15526 [4:01:32<45:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13048/15526 [4:01:33<45:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13048/15526 [4:01:33<45:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13049/15526 [4:01:33<45:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13049/15526 [4:01:33<45:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13050/15526 [4:01:35<45:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13050/15526 [4:01:35<45:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13051/15526 [4:01:35<45:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13051/15526 [4:01:35<45:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13052/15526 [4:01:36<45:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13052/15526 [4:01:36<45:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13053/15526 [4:01:37<45:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13053/15526 [4:01:37<45:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13054/15526 [4:01:38<45:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13054/15526 [4:01:38<45:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13055/15526 [4:01:39<45:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13055/15526 [4:01:39<45:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13056/15526 [4:01:45<45:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13056/15526 [4:01:45<45:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13057/15526 [4:01:46<45:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13057/15526 [4:01:46<45:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13058/15526 [4:01:47<45:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13058/15526 [4:01:47<45:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13059/15526 [4:01:48<45:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13059/15526 [4:01:48<45:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13060/15526 [4:01:49<45:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13060/15526 [4:01:49<45:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13061/15526 [4:01:50<45:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13061/15526 [4:01:50<45:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13062/15526 [4:01:51<45:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13062/15526 [4:01:51<45:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13063/15526 [4:01:52<45:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13063/15526 [4:01:52<45:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13064/15526 [4:01:53<45:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13064/15526 [4:01:53<45:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13065/15526 [4:01:54<45:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13065/15526 [4:01:54<45:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13066/15526 [4:01:55<45:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13066/15526 [4:01:55<45:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13067/15526 [4:01:56<45:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13067/15526 [4:01:56<45:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13068/15526 [4:01:57<45:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13068/15526 [4:01:57<45:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13069/15526 [4:01:57<45:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13069/15526 [4:01:57<45:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13070/15526 [4:01:59<45:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13070/15526 [4:01:59<45:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13071/15526 [4:01:59<45:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13071/15526 [4:01:59<45:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13072/15526 [4:02:00<45:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13072/15526 [4:02:00<45:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13073/15526 [4:02:01<45:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13073/15526 [4:02:01<45:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13074/15526 [4:02:02<45:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13074/15526 [4:02:02<45:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13075/15526 [4:02:03<45:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13075/15526 [4:02:03<45:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13076/15526 [4:02:04<45:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13076/15526 [4:02:04<45:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13077/15526 [4:02:05<45:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13077/15526 [4:02:05<45:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13078/15526 [4:02:06<45:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13078/15526 [4:02:06<45:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13079/15526 [4:02:07<45:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13079/15526 [4:02:07<45:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13080/15526 [4:02:08<45:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13080/15526 [4:02:08<45:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13081/15526 [4:02:09<45:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13081/15526 [4:02:09<45:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13082/15526 [4:02:10<45:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13082/15526 [4:02:10<45:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13083/15526 [4:02:11<45:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13083/15526 [4:02:11<45:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13084/15526 [4:02:11<45:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13084/15526 [4:02:11<45:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13085/15526 [4:02:13<45:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13085/15526 [4:02:13<45:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13086/15526 [4:02:13<45:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13086/15526 [4:02:13<45:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13087/15526 [4:02:14<45:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13087/15526 [4:02:14<45:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13088/15526 [4:02:20<45:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13088/15526 [4:02:20<45:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13089/15526 [4:02:21<45:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13089/15526 [4:02:21<45:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13090/15526 [4:02:22<45:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13090/15526 [4:02:22<45:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13091/15526 [4:02:23<45:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13091/15526 [4:02:23<45:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13092/15526 [4:02:24<45:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13092/15526 [4:02:24<45:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13093/15526 [4:02:25<45:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13093/15526 [4:02:25<45:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13094/15526 [4:02:26<45:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13094/15526 [4:02:26<45:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13095/15526 [4:02:27<45:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13095/15526 [4:02:27<45:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13096/15526 [4:02:27<44:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13096/15526 [4:02:27<44:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13097/15526 [4:02:29<44:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13097/15526 [4:02:29<44:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13098/15526 [4:02:29<44:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13098/15526 [4:02:29<44:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13099/15526 [4:02:30<44:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13099/15526 [4:02:30<44:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13100/15526 [4:02:31<44:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13100/15526 [4:02:31<44:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13101/15526 [4:02:32<44:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13101/15526 [4:02:32<44:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13102/15526 [4:02:33<44:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13102/15526 [4:02:33<44:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13103/15526 [4:02:34<44:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13103/15526 [4:02:34<44:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13104/15526 [4:02:35<44:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13104/15526 [4:02:35<44:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13105/15526 [4:02:37<44:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13105/15526 [4:02:37<44:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13106/15526 [4:02:37<44:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13106/15526 [4:02:37<44:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13107/15526 [4:02:38<44:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13107/15526 [4:02:38<44:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13108/15526 [4:02:39<44:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13108/15526 [4:02:39<44:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13109/15526 [4:02:40<44:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13109/15526 [4:02:40<44:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13110/15526 [4:02:40<44:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13110/15526 [4:02:40<44:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13111/15526 [4:02:42<44:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13111/15526 [4:02:42<44:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13112/15526 [4:02:43<44:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13112/15526 [4:02:43<44:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13113/15526 [4:02:44<44:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13113/15526 [4:02:44<44:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13114/15526 [4:02:45<44:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13114/15526 [4:02:45<44:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13115/15526 [4:02:47<44:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13115/15526 [4:02:47<44:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13116/15526 [4:02:48<44:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13116/15526 [4:02:48<44:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13117/15526 [4:02:49<44:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13117/15526 [4:02:49<44:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13118/15526 [4:02:50<44:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13118/15526 [4:02:50<44:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 13119/15526 [4:02:51<44:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  84%|▊| 13119/15526 [4:02:51<44:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13120/15526 [4:02:57<44:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13120/15526 [4:02:57<44:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13121/15526 [4:02:58<44:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13121/15526 [4:02:58<44:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13122/15526 [4:02:59<44:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13122/15526 [4:02:59<44:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13123/15526 [4:02:59<44:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13123/15526 [4:02:59<44:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13124/15526 [4:03:00<44:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13124/15526 [4:03:00<44:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13125/15526 [4:03:01<44:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13125/15526 [4:03:01<44:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13126/15526 [4:03:01<44:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13126/15526 [4:03:01<44:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13127/15526 [4:03:02<44:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13127/15526 [4:03:02<44:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13128/15526 [4:03:03<44:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13128/15526 [4:03:03<44:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13129/15526 [4:03:04<44:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13129/15526 [4:03:04<44:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13130/15526 [4:03:04<44:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13130/15526 [4:03:04<44:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13131/15526 [4:03:05<44:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13131/15526 [4:03:05<44:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13132/15526 [4:03:06<44:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13132/15526 [4:03:06<44:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13133/15526 [4:03:06<44:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13133/15526 [4:03:06<44:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13134/15526 [4:03:07<44:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13134/15526 [4:03:07<44:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13135/15526 [4:03:08<44:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13135/15526 [4:03:08<44:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13136/15526 [4:03:09<44:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13136/15526 [4:03:09<44:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13137/15526 [4:03:10<44:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13137/15526 [4:03:10<44:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13138/15526 [4:03:11<44:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13138/15526 [4:03:11<44:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13139/15526 [4:03:11<44:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13139/15526 [4:03:11<44:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13140/15526 [4:03:13<44:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13140/15526 [4:03:13<44:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13141/15526 [4:03:14<44:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13141/15526 [4:03:14<44:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13142/15526 [4:03:15<44:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13142/15526 [4:03:15<44:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13143/15526 [4:03:16<44:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13143/15526 [4:03:16<44:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13144/15526 [4:03:17<44:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13144/15526 [4:03:17<44:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13145/15526 [4:03:18<44:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13145/15526 [4:03:18<44:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13146/15526 [4:03:19<44:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13146/15526 [4:03:19<44:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13147/15526 [4:03:19<44:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13147/15526 [4:03:19<44:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13148/15526 [4:03:20<44:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13148/15526 [4:03:20<44:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13149/15526 [4:03:21<43:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13149/15526 [4:03:21<43:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13150/15526 [4:03:22<43:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13150/15526 [4:03:22<43:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13151/15526 [4:03:23<43:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13151/15526 [4:03:23<43:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13152/15526 [4:03:30<43:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13152/15526 [4:03:30<43:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13153/15526 [4:03:31<43:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13153/15526 [4:03:31<43:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13154/15526 [4:03:32<43:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13154/15526 [4:03:32<43:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13155/15526 [4:03:32<43:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13155/15526 [4:03:32<43:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13156/15526 [4:03:34<43:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13156/15526 [4:03:34<43:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13157/15526 [4:03:34<43:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13157/15526 [4:03:34<43:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13158/15526 [4:03:35<43:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13158/15526 [4:03:35<43:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13159/15526 [4:03:36<43:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13159/15526 [4:03:36<43:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13160/15526 [4:03:36<43:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13160/15526 [4:03:36<43:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13161/15526 [4:03:37<43:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13161/15526 [4:03:37<43:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13162/15526 [4:03:38<43:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13162/15526 [4:03:38<43:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13163/15526 [4:03:39<43:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13163/15526 [4:03:39<43:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13164/15526 [4:03:40<43:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13164/15526 [4:03:40<43:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13165/15526 [4:03:41<43:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13165/15526 [4:03:41<43:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13166/15526 [4:03:42<43:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13166/15526 [4:03:42<43:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13167/15526 [4:03:43<43:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13167/15526 [4:03:43<43:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13168/15526 [4:03:44<43:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13168/15526 [4:03:44<43:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13169/15526 [4:03:44<43:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13169/15526 [4:03:44<43:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13170/15526 [4:03:46<43:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13170/15526 [4:03:46<43:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13171/15526 [4:03:46<43:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13171/15526 [4:03:46<43:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13172/15526 [4:03:47<43:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13172/15526 [4:03:47<43:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13173/15526 [4:03:48<43:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13173/15526 [4:03:48<43:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13174/15526 [4:03:49<43:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13174/15526 [4:03:49<43:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13175/15526 [4:03:50<43:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13175/15526 [4:03:50<43:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13176/15526 [4:03:51<43:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13176/15526 [4:03:51<43:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13177/15526 [4:03:52<43:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13177/15526 [4:03:52<43:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13178/15526 [4:03:52<43:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13178/15526 [4:03:52<43:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13179/15526 [4:03:53<43:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13179/15526 [4:03:53<43:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13180/15526 [4:03:54<43:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13180/15526 [4:03:54<43:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13181/15526 [4:03:55<43:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13181/15526 [4:03:55<43:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13182/15526 [4:03:56<43:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13182/15526 [4:03:56<43:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13183/15526 [4:03:57<43:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13183/15526 [4:03:57<43:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13184/15526 [4:04:04<43:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13184/15526 [4:04:04<43:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13185/15526 [4:04:06<43:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13185/15526 [4:04:06<43:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13186/15526 [4:04:06<43:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13186/15526 [4:04:06<43:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13187/15526 [4:04:07<43:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13187/15526 [4:04:07<43:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13188/15526 [4:04:08<43:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13188/15526 [4:04:08<43:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13189/15526 [4:04:09<43:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13189/15526 [4:04:09<43:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13190/15526 [4:04:10<43:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13190/15526 [4:04:10<43:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13191/15526 [4:04:10<43:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13191/15526 [4:04:10<43:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13192/15526 [4:04:11<43:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13192/15526 [4:04:11<43:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13193/15526 [4:04:12<43:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13193/15526 [4:04:12<43:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13194/15526 [4:04:13<43:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13194/15526 [4:04:13<43:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13195/15526 [4:04:14<43:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13195/15526 [4:04:14<43:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13196/15526 [4:04:15<43:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13196/15526 [4:04:15<43:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13197/15526 [4:04:16<43:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13197/15526 [4:04:16<43:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13198/15526 [4:04:17<43:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13198/15526 [4:04:17<43:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13199/15526 [4:04:17<43:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13199/15526 [4:04:17<43:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13200/15526 [4:04:19<43:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13200/15526 [4:04:19<43:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13201/15526 [4:04:19<43:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13201/15526 [4:04:19<43:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13202/15526 [4:04:20<43:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13202/15526 [4:04:20<43:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13203/15526 [4:04:21<42:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13203/15526 [4:04:21<42:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13204/15526 [4:04:22<42:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13204/15526 [4:04:22<42:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13205/15526 [4:04:23<42:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13205/15526 [4:04:23<42:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13206/15526 [4:04:24<42:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13206/15526 [4:04:24<42:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13207/15526 [4:04:25<42:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13207/15526 [4:04:25<42:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13208/15526 [4:04:26<42:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13208/15526 [4:04:26<42:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13209/15526 [4:04:26<42:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13209/15526 [4:04:26<42:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13210/15526 [4:04:27<42:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13210/15526 [4:04:27<42:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13211/15526 [4:04:28<42:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13211/15526 [4:04:28<42:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13212/15526 [4:04:29<42:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13212/15526 [4:04:29<42:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13213/15526 [4:04:30<42:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13213/15526 [4:04:30<42:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13214/15526 [4:04:30<42:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13214/15526 [4:04:30<42:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13215/15526 [4:04:31<42:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13215/15526 [4:04:31<42:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13216/15526 [4:04:38<42:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13216/15526 [4:04:38<42:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13217/15526 [4:04:39<42:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13217/15526 [4:04:39<42:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13218/15526 [4:04:40<42:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13218/15526 [4:04:40<42:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13219/15526 [4:04:41<42:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13219/15526 [4:04:41<42:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13220/15526 [4:04:42<42:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13220/15526 [4:04:42<42:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13221/15526 [4:04:43<42:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13221/15526 [4:04:43<42:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13222/15526 [4:04:43<42:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13222/15526 [4:04:43<42:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13223/15526 [4:04:44<42:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13223/15526 [4:04:44<42:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13224/15526 [4:04:45<42:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13224/15526 [4:04:45<42:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13225/15526 [4:04:46<42:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13225/15526 [4:04:46<42:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13226/15526 [4:04:48<42:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13226/15526 [4:04:48<42:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13227/15526 [4:04:49<42:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13227/15526 [4:04:49<42:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13228/15526 [4:04:50<42:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13228/15526 [4:04:50<42:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13229/15526 [4:04:51<42:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13229/15526 [4:04:51<42:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13230/15526 [4:04:52<42:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13230/15526 [4:04:52<42:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13231/15526 [4:04:53<42:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13231/15526 [4:04:53<42:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13232/15526 [4:04:54<42:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13232/15526 [4:04:54<42:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13233/15526 [4:04:55<42:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13233/15526 [4:04:55<42:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13234/15526 [4:04:55<42:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13234/15526 [4:04:55<42:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13235/15526 [4:04:56<42:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13235/15526 [4:04:56<42:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13236/15526 [4:04:57<42:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13236/15526 [4:04:57<42:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13237/15526 [4:04:57<42:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13237/15526 [4:04:57<42:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13238/15526 [4:04:58<42:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13238/15526 [4:04:58<42:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13239/15526 [4:04:59<42:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13239/15526 [4:04:59<42:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13240/15526 [4:04:59<42:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13240/15526 [4:04:59<42:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13241/15526 [4:05:00<42:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13241/15526 [4:05:00<42:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13242/15526 [4:05:01<42:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13242/15526 [4:05:01<42:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13243/15526 [4:05:02<42:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13243/15526 [4:05:02<42:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13244/15526 [4:05:03<42:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13244/15526 [4:05:03<42:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13245/15526 [4:05:04<42:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13245/15526 [4:05:04<42:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13246/15526 [4:05:05<42:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13246/15526 [4:05:05<42:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13247/15526 [4:05:06<42:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13247/15526 [4:05:06<42:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13248/15526 [4:05:12<42:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13248/15526 [4:05:12<42:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13249/15526 [4:05:13<42:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13249/15526 [4:05:13<42:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13250/15526 [4:05:14<42:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13250/15526 [4:05:14<42:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|��| 13251/15526 [4:05:14<42:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13251/15526 [4:05:14<42:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13252/15526 [4:05:15<42:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13252/15526 [4:05:15<42:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13253/15526 [4:05:17<42:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13253/15526 [4:05:17<42:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13254/15526 [4:05:18<42:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13254/15526 [4:05:18<42:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13255/15526 [4:05:18<42:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13255/15526 [4:05:18<42:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13256/15526 [4:05:20<42:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13256/15526 [4:05:20<42:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13257/15526 [4:05:20<41:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13257/15526 [4:05:20<41:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13258/15526 [4:05:21<41:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13258/15526 [4:05:21<41:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13259/15526 [4:05:22<41:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13259/15526 [4:05:22<41:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13260/15526 [4:05:23<41:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13260/15526 [4:05:23<41:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13261/15526 [4:05:24<41:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13261/15526 [4:05:24<41:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13262/15526 [4:05:25<41:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13262/15526 [4:05:25<41:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13263/15526 [4:05:25<41:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13263/15526 [4:05:25<41:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13264/15526 [4:05:26<41:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13264/15526 [4:05:26<41:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13265/15526 [4:05:27<41:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13265/15526 [4:05:27<41:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13266/15526 [4:05:28<41:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13266/15526 [4:05:28<41:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13267/15526 [4:05:28<41:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13267/15526 [4:05:28<41:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13268/15526 [4:05:29<41:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13268/15526 [4:05:29<41:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13269/15526 [4:05:30<41:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13269/15526 [4:05:30<41:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13270/15526 [4:05:31<41:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13270/15526 [4:05:31<41:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13271/15526 [4:05:32<41:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13271/15526 [4:05:32<41:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13272/15526 [4:05:33<41:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13272/15526 [4:05:33<41:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13273/15526 [4:05:34<41:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13273/15526 [4:05:34<41:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 13274/15526 [4:05:35<41:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  85%|▊| 13274/15526 [4:05:35<41:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13275/15526 [4:05:36<41:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13275/15526 [4:05:36<41:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13276/15526 [4:05:36<41:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13276/15526 [4:05:36<41:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13277/15526 [4:05:37<41:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13277/15526 [4:05:37<41:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13278/15526 [4:05:38<41:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13278/15526 [4:05:38<41:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13279/15526 [4:05:38<41:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13279/15526 [4:05:38<41:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13280/15526 [4:05:47<41:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13280/15526 [4:05:47<41:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13281/15526 [4:05:48<41:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13281/15526 [4:05:48<41:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13282/15526 [4:05:49<41:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13282/15526 [4:05:49<41:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13283/15526 [4:05:50<41:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13283/15526 [4:05:50<41:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13284/15526 [4:05:51<41:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13284/15526 [4:05:51<41:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13285/15526 [4:05:52<41:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13285/15526 [4:05:52<41:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13286/15526 [4:05:53<41:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13286/15526 [4:05:53<41:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13287/15526 [4:05:53<41:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13287/15526 [4:05:53<41:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13288/15526 [4:05:54<41:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13288/15526 [4:05:54<41:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13289/15526 [4:05:55<41:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13289/15526 [4:05:55<41:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13290/15526 [4:05:55<41:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13290/15526 [4:05:55<41:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13291/15526 [4:05:56<41:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13291/15526 [4:05:56<41:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13292/15526 [4:05:57<41:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13292/15526 [4:05:57<41:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13293/15526 [4:05:58<41:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13293/15526 [4:05:58<41:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13294/15526 [4:05:59<41:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13294/15526 [4:05:59<41:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13295/15526 [4:05:59<41:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13295/15526 [4:05:59<41:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13296/15526 [4:06:00<41:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13296/15526 [4:06:00<41:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13297/15526 [4:06:01<41:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13297/15526 [4:06:01<41:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13298/15526 [4:06:01<41:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13298/15526 [4:06:01<41:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13299/15526 [4:06:02<41:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13299/15526 [4:06:02<41:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13300/15526 [4:06:03<41:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13300/15526 [4:06:03<41:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13301/15526 [4:06:05<41:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13301/15526 [4:06:05<41:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13302/15526 [4:06:05<41:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13302/15526 [4:06:05<41:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13303/15526 [4:06:06<41:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13303/15526 [4:06:06<41:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13304/15526 [4:06:07<41:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13304/15526 [4:06:07<41:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13305/15526 [4:06:08<41:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13305/15526 [4:06:08<41:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13306/15526 [4:06:08<41:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13306/15526 [4:06:08<41:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13307/15526 [4:06:09<41:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13307/15526 [4:06:09<41:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13308/15526 [4:06:10<41:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13308/15526 [4:06:10<41:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13309/15526 [4:06:10<41:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13309/15526 [4:06:10<41:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13310/15526 [4:06:11<40:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13310/15526 [4:06:11<40:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13311/15526 [4:06:12<40:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13311/15526 [4:06:12<40:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13312/15526 [4:06:20<40:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13312/15526 [4:06:20<40:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13313/15526 [4:06:21<40:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13313/15526 [4:06:21<40:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13314/15526 [4:06:22<40:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13314/15526 [4:06:22<40:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13315/15526 [4:06:23<40:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13315/15526 [4:06:23<40:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13316/15526 [4:06:24<40:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13316/15526 [4:06:24<40:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13317/15526 [4:06:24<40:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13317/15526 [4:06:24<40:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13318/15526 [4:06:25<40:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13318/15526 [4:06:25<40:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13319/15526 [4:06:26<40:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13319/15526 [4:06:26<40:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13320/15526 [4:06:27<40:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13320/15526 [4:06:27<40:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13321/15526 [4:06:28<40:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13321/15526 [4:06:28<40:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13322/15526 [4:06:28<40:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13322/15526 [4:06:28<40:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13323/15526 [4:06:29<40:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13323/15526 [4:06:29<40:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13324/15526 [4:06:30<40:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13324/15526 [4:06:30<40:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13325/15526 [4:06:31<40:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13325/15526 [4:06:31<40:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13326/15526 [4:06:31<40:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13326/15526 [4:06:31<40:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13327/15526 [4:06:32<40:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13327/15526 [4:06:32<40:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13328/15526 [4:06:33<40:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13328/15526 [4:06:33<40:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13329/15526 [4:06:34<40:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13329/15526 [4:06:34<40:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13330/15526 [4:06:34<40:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13330/15526 [4:06:34<40:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13331/15526 [4:06:35<40:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13331/15526 [4:06:35<40:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13332/15526 [4:06:36<40:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13332/15526 [4:06:36<40:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13333/15526 [4:06:37<40:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13333/15526 [4:06:37<40:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13334/15526 [4:06:38<40:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13334/15526 [4:06:38<40:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13335/15526 [4:06:40<40:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13335/15526 [4:06:40<40:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13336/15526 [4:06:40<40:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13336/15526 [4:06:40<40:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13337/15526 [4:06:42<40:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13337/15526 [4:06:42<40:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13338/15526 [4:06:42<40:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13338/15526 [4:06:42<40:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13339/15526 [4:06:43<40:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13339/15526 [4:06:43<40:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13340/15526 [4:06:44<40:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13340/15526 [4:06:44<40:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13341/15526 [4:06:45<40:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13341/15526 [4:06:45<40:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13342/15526 [4:06:46<40:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13342/15526 [4:06:46<40:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13343/15526 [4:06:47<40:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13343/15526 [4:06:47<40:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13344/15526 [4:06:55<40:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13344/15526 [4:06:55<40:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13345/15526 [4:06:56<40:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13345/15526 [4:06:56<40:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13346/15526 [4:06:58<40:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13346/15526 [4:06:58<40:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13347/15526 [4:06:58<40:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13347/15526 [4:06:58<40:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13348/15526 [4:06:59<40:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13348/15526 [4:06:59<40:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13349/15526 [4:07:00<40:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13349/15526 [4:07:00<40:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13350/15526 [4:07:01<40:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13350/15526 [4:07:01<40:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13351/15526 [4:07:02<40:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13351/15526 [4:07:02<40:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13352/15526 [4:07:03<40:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13352/15526 [4:07:03<40:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13353/15526 [4:07:03<40:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13353/15526 [4:07:03<40:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13354/15526 [4:07:04<40:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13354/15526 [4:07:04<40:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13355/15526 [4:07:05<40:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13355/15526 [4:07:05<40:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13356/15526 [4:07:07<40:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13356/15526 [4:07:07<40:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13357/15526 [4:07:07<40:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13357/15526 [4:07:07<40:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13358/15526 [4:07:08<40:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13358/15526 [4:07:08<40:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13359/15526 [4:07:09<40:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13359/15526 [4:07:09<40:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13360/15526 [4:07:09<40:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13360/15526 [4:07:09<40:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13361/15526 [4:07:11<40:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13361/15526 [4:07:11<40:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13362/15526 [4:07:11<40:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13362/15526 [4:07:11<40:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13363/15526 [4:07:12<40:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13363/15526 [4:07:12<40:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13364/15526 [4:07:13<39:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13364/15526 [4:07:13<39:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13365/15526 [4:07:13<39:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13365/15526 [4:07:13<39:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13366/15526 [4:07:14<39:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13366/15526 [4:07:14<39:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13367/15526 [4:07:15<39:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13367/15526 [4:07:15<39:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13368/15526 [4:07:15<39:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13368/15526 [4:07:15<39:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13369/15526 [4:07:16<39:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13369/15526 [4:07:16<39:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13370/15526 [4:07:17<39:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13370/15526 [4:07:17<39:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13371/15526 [4:07:19<39:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13371/15526 [4:07:19<39:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13372/15526 [4:07:20<39:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13372/15526 [4:07:20<39:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13373/15526 [4:07:21<39:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13373/15526 [4:07:21<39:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13374/15526 [4:07:22<39:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13374/15526 [4:07:22<39:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13375/15526 [4:07:22<39:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13375/15526 [4:07:22<39:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13376/15526 [4:07:31<39:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13376/15526 [4:07:31<39:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13377/15526 [4:07:32<39:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13377/15526 [4:07:32<39:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13378/15526 [4:07:33<39:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13378/15526 [4:07:33<39:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13379/15526 [4:07:34<39:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13379/15526 [4:07:34<39:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13380/15526 [4:07:35<39:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13380/15526 [4:07:35<39:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13381/15526 [4:07:36<39:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13381/15526 [4:07:36<39:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13382/15526 [4:07:37<39:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13382/15526 [4:07:37<39:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13383/15526 [4:07:38<39:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13383/15526 [4:07:38<39:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13384/15526 [4:07:39<39:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13384/15526 [4:07:39<39:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13385/15526 [4:07:39<39:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13385/15526 [4:07:39<39:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13386/15526 [4:07:40<39:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13386/15526 [4:07:40<39:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13387/15526 [4:07:41<39:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13387/15526 [4:07:41<39:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13388/15526 [4:07:41<39:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13388/15526 [4:07:41<39:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13389/15526 [4:07:42<39:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13389/15526 [4:07:42<39:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13390/15526 [4:07:43<39:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13390/15526 [4:07:43<39:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13391/15526 [4:07:45<39:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13391/15526 [4:07:45<39:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13392/15526 [4:07:46<39:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13392/15526 [4:07:46<39:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13393/15526 [4:07:46<39:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13393/15526 [4:07:46<39:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13394/15526 [4:07:48<39:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13394/15526 [4:07:48<39:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13395/15526 [4:07:48<39:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13395/15526 [4:07:48<39:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13396/15526 [4:07:49<39:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13396/15526 [4:07:49<39:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13397/15526 [4:07:50<39:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13397/15526 [4:07:50<39:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13398/15526 [4:07:51<39:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13398/15526 [4:07:51<39:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13399/15526 [4:07:52<39:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13399/15526 [4:07:52<39:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13400/15526 [4:07:52<39:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13400/15526 [4:07:52<39:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13401/15526 [4:07:54<39:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13401/15526 [4:07:54<39:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13402/15526 [4:07:54<39:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13402/15526 [4:07:54<39:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13403/15526 [4:07:55<39:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13403/15526 [4:07:55<39:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13404/15526 [4:07:56<39:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13404/15526 [4:07:56<39:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13405/15526 [4:07:57<39:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13405/15526 [4:07:57<39:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13406/15526 [4:07:58<39:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|���| 13406/15526 [4:07:58<39:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13407/15526 [4:07:59<39:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13407/15526 [4:07:59<39:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13408/15526 [4:08:05<39:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13408/15526 [4:08:05<39:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13409/15526 [4:08:06<39:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13409/15526 [4:08:06<39:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13410/15526 [4:08:06<39:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13410/15526 [4:08:06<39:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13411/15526 [4:08:07<39:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13411/15526 [4:08:07<39:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13412/15526 [4:08:08<39:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13412/15526 [4:08:08<39:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13413/15526 [4:08:09<39:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13413/15526 [4:08:09<39:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13414/15526 [4:08:11<39:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13414/15526 [4:08:11<39:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13415/15526 [4:08:11<39:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13415/15526 [4:08:11<39:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13416/15526 [4:08:12<39:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13416/15526 [4:08:12<39:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13417/15526 [4:08:13<39:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13417/15526 [4:08:13<39:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13418/15526 [4:08:13<38:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13418/15526 [4:08:13<38:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13419/15526 [4:08:14<38:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13419/15526 [4:08:14<38:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13420/15526 [4:08:15<38:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13420/15526 [4:08:15<38:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13421/15526 [4:08:15<38:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13421/15526 [4:08:15<38:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13422/15526 [4:08:16<38:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13422/15526 [4:08:16<38:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13423/15526 [4:08:17<38:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13423/15526 [4:08:17<38:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13424/15526 [4:08:18<38:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13424/15526 [4:08:18<38:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13425/15526 [4:08:19<38:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13425/15526 [4:08:19<38:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13426/15526 [4:08:20<38:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13426/15526 [4:08:20<38:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13427/15526 [4:08:21<38:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13427/15526 [4:08:21<38:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13428/15526 [4:08:22<38:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13428/15526 [4:08:22<38:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 13429/15526 [4:08:23<38:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  86%|▊| 13429/15526 [4:08:23<38:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13430/15526 [4:08:24<38:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13430/15526 [4:08:24<38:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13431/15526 [4:08:25<38:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13431/15526 [4:08:25<38:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13432/15526 [4:08:26<38:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13432/15526 [4:08:26<38:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13433/15526 [4:08:26<38:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13433/15526 [4:08:26<38:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13434/15526 [4:08:27<38:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13434/15526 [4:08:27<38:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13435/15526 [4:08:29<38:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13435/15526 [4:08:29<38:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13436/15526 [4:08:30<38:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13436/15526 [4:08:30<38:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13437/15526 [4:08:30<38:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13437/15526 [4:08:30<38:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13438/15526 [4:08:32<38:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13438/15526 [4:08:32<38:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13439/15526 [4:08:32<38:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13439/15526 [4:08:32<38:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13440/15526 [4:08:40<38:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13440/15526 [4:08:40<38:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13441/15526 [4:08:41<38:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13441/15526 [4:08:41<38:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13442/15526 [4:08:42<38:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13442/15526 [4:08:42<38:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13443/15526 [4:08:43<38:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13443/15526 [4:08:43<38:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13444/15526 [4:08:44<38:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13444/15526 [4:08:44<38:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13445/15526 [4:08:45<38:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13445/15526 [4:08:45<38:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13446/15526 [4:08:45<38:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13446/15526 [4:08:45<38:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13447/15526 [4:08:46<38:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13447/15526 [4:08:46<38:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13448/15526 [4:08:48<38:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13448/15526 [4:08:48<38:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13449/15526 [4:08:48<38:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13449/15526 [4:08:48<38:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13450/15526 [4:08:50<38:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13450/15526 [4:08:50<38:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13451/15526 [4:08:51<38:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13451/15526 [4:08:51<38:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13452/15526 [4:08:52<38:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13452/15526 [4:08:52<38:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13453/15526 [4:08:52<38:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13453/15526 [4:08:52<38:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13454/15526 [4:08:53<38:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13454/15526 [4:08:53<38:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13455/15526 [4:08:54<38:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13455/15526 [4:08:54<38:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13456/15526 [4:08:55<38:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13456/15526 [4:08:55<38:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13457/15526 [4:08:56<38:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13457/15526 [4:08:56<38:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13458/15526 [4:08:57<38:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13458/15526 [4:08:57<38:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13459/15526 [4:08:58<38:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13459/15526 [4:08:58<38:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13460/15526 [4:08:59<38:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13460/15526 [4:08:59<38:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13461/15526 [4:08:59<38:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13461/15526 [4:08:59<38:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13462/15526 [4:09:01<38:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13462/15526 [4:09:01<38:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13463/15526 [4:09:02<38:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13463/15526 [4:09:02<38:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13464/15526 [4:09:03<38:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13464/15526 [4:09:03<38:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13465/15526 [4:09:03<38:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13465/15526 [4:09:03<38:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13466/15526 [4:09:04<38:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13466/15526 [4:09:04<38:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13467/15526 [4:09:05<38:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13467/15526 [4:09:05<38:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13468/15526 [4:09:06<38:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13468/15526 [4:09:06<38:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13469/15526 [4:09:07<38:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13469/15526 [4:09:07<38:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13470/15526 [4:09:08<38:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13470/15526 [4:09:08<38:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13471/15526 [4:09:09<38:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13471/15526 [4:09:09<38:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13472/15526 [4:09:16<38:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13472/15526 [4:09:16<38:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13473/15526 [4:09:16<37:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13473/15526 [4:09:16<37:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13474/15526 [4:09:17<37:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13474/15526 [4:09:17<37:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13475/15526 [4:09:18<37:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13475/15526 [4:09:18<37:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13476/15526 [4:09:19<37:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13476/15526 [4:09:19<37:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13477/15526 [4:09:20<37:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13477/15526 [4:09:20<37:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13478/15526 [4:09:21<37:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13478/15526 [4:09:21<37:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13479/15526 [4:09:22<37:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13479/15526 [4:09:22<37:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13480/15526 [4:09:23<37:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13480/15526 [4:09:23<37:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13481/15526 [4:09:23<37:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13481/15526 [4:09:23<37:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13482/15526 [4:09:25<37:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13482/15526 [4:09:25<37:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13483/15526 [4:09:26<37:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13483/15526 [4:09:26<37:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13484/15526 [4:09:27<37:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13484/15526 [4:09:27<37:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13485/15526 [4:09:28<37:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13485/15526 [4:09:28<37:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13486/15526 [4:09:28<37:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13486/15526 [4:09:28<37:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13487/15526 [4:09:29<37:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13487/15526 [4:09:29<37:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13488/15526 [4:09:30<37:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13488/15526 [4:09:30<37:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13489/15526 [4:09:30<37:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13489/15526 [4:09:30<37:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13490/15526 [4:09:31<37:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13490/15526 [4:09:31<37:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13491/15526 [4:09:32<37:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13491/15526 [4:09:32<37:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13492/15526 [4:09:33<37:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13492/15526 [4:09:33<37:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13493/15526 [4:09:34<37:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13493/15526 [4:09:34<37:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13494/15526 [4:09:34<37:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13494/15526 [4:09:34<37:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13495/15526 [4:09:35<37:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13495/15526 [4:09:35<37:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13496/15526 [4:09:36<37:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13496/15526 [4:09:36<37:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13497/15526 [4:09:36<37:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13497/15526 [4:09:36<37:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13498/15526 [4:09:37<37:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13498/15526 [4:09:37<37:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13499/15526 [4:09:38<37:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13499/15526 [4:09:38<37:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13500/15526 [4:09:40<37:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13500/15526 [4:09:40<37:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13501/15526 [4:09:40<37:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13501/15526 [4:09:40<37:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13502/15526 [4:09:41<37:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13502/15526 [4:09:41<37:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13503/15526 [4:09:41<37:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13503/15526 [4:09:41<37:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13504/15526 [4:09:51<37:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13504/15526 [4:09:51<37:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13505/15526 [4:09:52<37:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13505/15526 [4:09:52<37:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13506/15526 [4:09:52<37:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13506/15526 [4:09:52<37:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13507/15526 [4:09:54<37:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13507/15526 [4:09:54<37:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13508/15526 [4:09:55<37:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13508/15526 [4:09:55<37:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13509/15526 [4:09:56<37:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13509/15526 [4:09:56<37:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13510/15526 [4:09:56<37:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13510/15526 [4:09:56<37:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13511/15526 [4:09:57<37:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13511/15526 [4:09:57<37:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13512/15526 [4:09:58<37:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13512/15526 [4:09:58<37:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13513/15526 [4:09:59<37:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13513/15526 [4:09:59<37:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13514/15526 [4:10:00<37:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13514/15526 [4:10:00<37:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13515/15526 [4:10:01<37:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13515/15526 [4:10:01<37:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13516/15526 [4:10:01<37:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13516/15526 [4:10:01<37:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13517/15526 [4:10:02<37:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13517/15526 [4:10:02<37:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13518/15526 [4:10:03<37:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13518/15526 [4:10:03<37:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13519/15526 [4:10:04<37:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13519/15526 [4:10:04<37:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13520/15526 [4:10:05<37:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13520/15526 [4:10:05<37:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13521/15526 [4:10:06<37:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13521/15526 [4:10:06<37:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13522/15526 [4:10:07<37:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13522/15526 [4:10:07<37:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13523/15526 [4:10:08<37:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13523/15526 [4:10:08<37:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13524/15526 [4:10:09<37:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13524/15526 [4:10:09<37:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13525/15526 [4:10:10<37:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13525/15526 [4:10:10<37:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13526/15526 [4:10:11<36:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13526/15526 [4:10:11<36:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13527/15526 [4:10:12<36:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13527/15526 [4:10:12<36:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13528/15526 [4:10:12<36:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13528/15526 [4:10:12<36:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13529/15526 [4:10:14<36:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13529/15526 [4:10:14<36:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13530/15526 [4:10:14<36:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13530/15526 [4:10:14<36:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13531/15526 [4:10:15<36:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13531/15526 [4:10:15<36:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13532/15526 [4:10:16<36:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13532/15526 [4:10:16<36:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13533/15526 [4:10:17<36:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13533/15526 [4:10:17<36:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13534/15526 [4:10:18<36:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13534/15526 [4:10:18<36:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13535/15526 [4:10:18<36:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13535/15526 [4:10:18<36:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13536/15526 [4:10:26<36:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13536/15526 [4:10:26<36:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13537/15526 [4:10:28<36:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13537/15526 [4:10:28<36:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13538/15526 [4:10:28<36:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13538/15526 [4:10:28<36:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13539/15526 [4:10:29<36:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13539/15526 [4:10:29<36:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13540/15526 [4:10:30<36:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13540/15526 [4:10:30<36:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13541/15526 [4:10:30<36:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13541/15526 [4:10:30<36:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13542/15526 [4:10:32<36:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13542/15526 [4:10:32<36:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13543/15526 [4:10:32<36:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13543/15526 [4:10:32<36:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13544/15526 [4:10:33<36:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13544/15526 [4:10:33<36:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13545/15526 [4:10:35<36:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13545/15526 [4:10:35<36:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13546/15526 [4:10:36<36:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13546/15526 [4:10:36<36:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13547/15526 [4:10:36<36:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13547/15526 [4:10:36<36:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13548/15526 [4:10:38<36:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13548/15526 [4:10:38<36:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13549/15526 [4:10:39<36:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13549/15526 [4:10:39<36:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13550/15526 [4:10:40<36:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13550/15526 [4:10:40<36:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13551/15526 [4:10:41<36:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13551/15526 [4:10:41<36:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13552/15526 [4:10:41<36:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13552/15526 [4:10:41<36:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13553/15526 [4:10:42<36:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13553/15526 [4:10:42<36:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13554/15526 [4:10:43<36:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13554/15526 [4:10:43<36:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13555/15526 [4:10:44<36:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13555/15526 [4:10:44<36:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13556/15526 [4:10:44<36:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13556/15526 [4:10:44<36:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13557/15526 [4:10:45<36:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13557/15526 [4:10:45<36:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13558/15526 [4:10:46<36:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13558/15526 [4:10:46<36:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13559/15526 [4:10:47<36:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13559/15526 [4:10:47<36:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13560/15526 [4:10:48<36:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13560/15526 [4:10:48<36:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13561/15526 [4:10:48<36:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13561/15526 [4:10:48<36:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13562/15526 [4:10:49<36:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13562/15526 [4:10:49<36:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13563/15526 [4:10:50<36:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13563/15526 [4:10:50<36:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13564/15526 [4:10:51<36:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13564/15526 [4:10:51<36:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13565/15526 [4:10:52<36:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13565/15526 [4:10:52<36:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13566/15526 [4:10:53<36:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13566/15526 [4:10:53<36:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13567/15526 [4:10:53<36:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13567/15526 [4:10:53<36:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13568/15526 [4:11:02<36:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13568/15526 [4:11:02<36:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13569/15526 [4:11:03<36:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13569/15526 [4:11:03<36:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13570/15526 [4:11:04<36:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13570/15526 [4:11:04<36:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13571/15526 [4:11:04<36:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13571/15526 [4:11:04<36:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13572/15526 [4:11:05<36:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13572/15526 [4:11:05<36:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13573/15526 [4:11:07<36:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13573/15526 [4:11:07<36:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13574/15526 [4:11:08<36:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13574/15526 [4:11:08<36:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13575/15526 [4:11:09<36:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13575/15526 [4:11:09<36:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13576/15526 [4:11:10<36:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13576/15526 [4:11:10<36:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13577/15526 [4:11:11<36:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13577/15526 [4:11:11<36:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13578/15526 [4:11:12<36:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13578/15526 [4:11:12<36:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13579/15526 [4:11:13<36:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13579/15526 [4:11:13<36:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13580/15526 [4:11:13<36:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13580/15526 [4:11:13<36:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13581/15526 [4:11:14<35:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13581/15526 [4:11:14<35:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13582/15526 [4:11:15<35:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13582/15526 [4:11:15<35:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13583/15526 [4:11:16<35:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13583/15526 [4:11:16<35:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13584/15526 [4:11:17<35:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13584/15526 [4:11:17<35:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 13585/15526 [4:11:18<35:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  87%|▊| 13585/15526 [4:11:18<35:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13586/15526 [4:11:19<35:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13586/15526 [4:11:19<35:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13587/15526 [4:11:20<35:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13587/15526 [4:11:20<35:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13588/15526 [4:11:22<35:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13588/15526 [4:11:22<35:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13589/15526 [4:11:23<35:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13589/15526 [4:11:23<35:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13590/15526 [4:11:24<35:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13590/15526 [4:11:24<35:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13591/15526 [4:11:25<35:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13591/15526 [4:11:25<35:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13592/15526 [4:11:26<35:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13592/15526 [4:11:26<35:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13593/15526 [4:11:28<35:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13593/15526 [4:11:28<35:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13594/15526 [4:11:28<35:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13594/15526 [4:11:28<35:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13595/15526 [4:11:30<35:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13595/15526 [4:11:30<35:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13596/15526 [4:11:31<35:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13596/15526 [4:11:31<35:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13597/15526 [4:11:32<35:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13597/15526 [4:11:32<35:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13598/15526 [4:11:33<35:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13598/15526 [4:11:33<35:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13599/15526 [4:11:33<35:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13599/15526 [4:11:33<35:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13600/15526 [4:11:39<35:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13600/15526 [4:11:39<35:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13601/15526 [4:12:04<35:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13601/15526 [4:12:04<35:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13602/15526 [4:12:05<35:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13602/15526 [4:12:05<35:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13603/15526 [4:12:06<35:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13603/15526 [4:12:06<35:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13604/15526 [4:12:07<35:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13604/15526 [4:12:07<35:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13605/15526 [4:12:08<35:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13605/15526 [4:12:08<35:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13606/15526 [4:12:09<35:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13606/15526 [4:12:09<35:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13607/15526 [4:12:10<35:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13607/15526 [4:12:10<35:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13608/15526 [4:12:10<35:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13608/15526 [4:12:10<35:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13609/15526 [4:12:11<35:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13609/15526 [4:12:11<35:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13610/15526 [4:12:12<35:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13610/15526 [4:12:12<35:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13611/15526 [4:12:13<35:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13611/15526 [4:12:13<35:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13612/15526 [4:12:14<35:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13612/15526 [4:12:14<35:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13613/15526 [4:12:15<35:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13613/15526 [4:12:15<35:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13614/15526 [4:12:16<35:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13614/15526 [4:12:16<35:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13615/15526 [4:12:17<35:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13615/15526 [4:12:17<35:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13616/15526 [4:12:17<35:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13616/15526 [4:12:17<35:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13617/15526 [4:12:18<35:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13617/15526 [4:12:18<35:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13618/15526 [4:12:19<35:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13618/15526 [4:12:19<35:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13619/15526 [4:12:20<35:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13619/15526 [4:12:20<35:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13620/15526 [4:12:20<35:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13620/15526 [4:12:20<35:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13621/15526 [4:12:21<35:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13621/15526 [4:12:21<35:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13622/15526 [4:12:22<35:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13622/15526 [4:12:22<35:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13623/15526 [4:12:23<35:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13623/15526 [4:12:23<35:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13624/15526 [4:12:24<35:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13624/15526 [4:12:24<35:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13625/15526 [4:12:25<35:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13625/15526 [4:12:25<35:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13626/15526 [4:12:26<35:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13626/15526 [4:12:26<35:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13627/15526 [4:12:27<35:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13627/15526 [4:12:27<35:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13628/15526 [4:12:28<35:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13628/15526 [4:12:28<35:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13629/15526 [4:12:29<35:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13629/15526 [4:12:29<35:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13630/15526 [4:12:30<35:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13630/15526 [4:12:30<35:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13631/15526 [4:12:31<35:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13631/15526 [4:12:31<35:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13632/15526 [4:12:38<35:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13632/15526 [4:12:38<35:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13633/15526 [4:12:39<35:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13633/15526 [4:12:39<35:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13634/15526 [4:12:40<35:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13634/15526 [4:12:40<35:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13635/15526 [4:12:41<35:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13635/15526 [4:12:41<35:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13636/15526 [4:12:42<35:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13636/15526 [4:12:42<35:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13637/15526 [4:12:42<35:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13637/15526 [4:12:42<35:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13638/15526 [4:12:44<34:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13638/15526 [4:12:44<34:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13639/15526 [4:12:44<34:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13639/15526 [4:12:44<34:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13640/15526 [4:12:45<34:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13640/15526 [4:12:45<34:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13641/15526 [4:12:46<34:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13641/15526 [4:12:46<34:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13642/15526 [4:12:47<34:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13642/15526 [4:12:47<34:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13643/15526 [4:12:48<34:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13643/15526 [4:12:48<34:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13644/15526 [4:12:49<34:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13644/15526 [4:12:49<34:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13645/15526 [4:12:50<34:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13645/15526 [4:12:50<34:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13646/15526 [4:12:51<34:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13646/15526 [4:12:51<34:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13647/15526 [4:12:51<34:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13647/15526 [4:12:51<34:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13648/15526 [4:12:53<34:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13648/15526 [4:12:53<34:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13649/15526 [4:12:53<34:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13649/15526 [4:12:53<34:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13650/15526 [4:12:54<34:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13650/15526 [4:12:54<34:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13651/15526 [4:12:55<34:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13651/15526 [4:12:55<34:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13652/15526 [4:12:55<34:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13652/15526 [4:12:55<34:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13653/15526 [4:12:56<34:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13653/15526 [4:12:56<34:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13654/15526 [4:12:57<34:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13654/15526 [4:12:57<34:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13655/15526 [4:12:57<34:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13655/15526 [4:12:57<34:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13656/15526 [4:12:58<34:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13656/15526 [4:12:58<34:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13657/15526 [4:12:59<34:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13657/15526 [4:12:59<34:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13658/15526 [4:13:00<34:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13658/15526 [4:13:00<34:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13659/15526 [4:13:01<34:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13659/15526 [4:13:01<34:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13660/15526 [4:13:02<34:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13660/15526 [4:13:02<34:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13661/15526 [4:13:03<34:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13661/15526 [4:13:03<34:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13662/15526 [4:13:04<34:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13662/15526 [4:13:04<34:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13663/15526 [4:13:05<34:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13663/15526 [4:13:05<34:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13664/15526 [4:13:16<34:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13664/15526 [4:13:16<34:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13665/15526 [4:13:16<34:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13665/15526 [4:13:16<34:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13666/15526 [4:13:17<34:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13666/15526 [4:13:17<34:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13667/15526 [4:13:18<34:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13667/15526 [4:13:18<34:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13668/15526 [4:13:19<34:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13668/15526 [4:13:19<34:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13669/15526 [4:13:20<34:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13669/15526 [4:13:20<34:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13670/15526 [4:13:21<34:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13670/15526 [4:13:21<34:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13671/15526 [4:13:22<34:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13671/15526 [4:13:22<34:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13672/15526 [4:13:22<34:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13672/15526 [4:13:22<34:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13673/15526 [4:13:23<34:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13673/15526 [4:13:23<34:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13674/15526 [4:13:24<34:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13674/15526 [4:13:24<34:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13675/15526 [4:13:25<34:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13675/15526 [4:13:25<34:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13676/15526 [4:13:26<34:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13676/15526 [4:13:26<34:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13677/15526 [4:13:27<34:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13677/15526 [4:13:27<34:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13678/15526 [4:13:28<34:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13678/15526 [4:13:28<34:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13679/15526 [4:13:29<34:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13679/15526 [4:13:29<34:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13680/15526 [4:13:29<34:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13680/15526 [4:13:29<34:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13681/15526 [4:13:30<34:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13681/15526 [4:13:30<34:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13682/15526 [4:13:31<34:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13682/15526 [4:13:31<34:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13683/15526 [4:13:32<34:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13683/15526 [4:13:32<34:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13684/15526 [4:13:33<34:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13684/15526 [4:13:33<34:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13685/15526 [4:13:34<34:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13685/15526 [4:13:34<34:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13686/15526 [4:13:34<34:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13686/15526 [4:13:34<34:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13687/15526 [4:13:36<34:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13687/15526 [4:13:36<34:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13688/15526 [4:13:36<34:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13688/15526 [4:13:36<34:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13689/15526 [4:13:37<34:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13689/15526 [4:13:37<34:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13690/15526 [4:13:38<34:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13690/15526 [4:13:38<34:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13691/15526 [4:13:39<33:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13691/15526 [4:13:39<33:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13692/15526 [4:13:40<33:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13692/15526 [4:13:40<33:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13693/15526 [4:13:41<33:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13693/15526 [4:13:41<33:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13694/15526 [4:13:42<33:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13694/15526 [4:13:42<33:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13695/15526 [4:13:43<33:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13695/15526 [4:13:43<33:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13696/15526 [4:13:50<33:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13696/15526 [4:13:50<33:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13697/15526 [4:13:51<33:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13697/15526 [4:13:51<33:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13698/15526 [4:13:52<33:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13698/15526 [4:13:52<33:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13699/15526 [4:13:53<33:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13699/15526 [4:13:53<33:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13700/15526 [4:13:54<33:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13700/15526 [4:13:54<33:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13701/15526 [4:13:55<33:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13701/15526 [4:13:55<33:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13702/15526 [4:13:56<33:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13702/15526 [4:13:56<33:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13703/15526 [4:13:56<33:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13703/15526 [4:13:56<33:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13704/15526 [4:13:57<33:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13704/15526 [4:13:57<33:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13705/15526 [4:13:58<33:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13705/15526 [4:13:58<33:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13706/15526 [4:13:59<33:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13706/15526 [4:13:59<33:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13707/15526 [4:13:59<33:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13707/15526 [4:13:59<33:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13708/15526 [4:14:00<33:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13708/15526 [4:14:00<33:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13709/15526 [4:14:01<33:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13709/15526 [4:14:01<33:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13710/15526 [4:14:01<33:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13710/15526 [4:14:01<33:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13711/15526 [4:14:02<33:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13711/15526 [4:14:02<33:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13712/15526 [4:14:03<33:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13712/15526 [4:14:03<33:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13713/15526 [4:14:04<33:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13713/15526 [4:14:04<33:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13714/15526 [4:14:05<33:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13714/15526 [4:14:05<33:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13715/15526 [4:14:06<33:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13715/15526 [4:14:06<33:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13716/15526 [4:14:07<33:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13716/15526 [4:14:07<33:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13717/15526 [4:14:08<33:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13717/15526 [4:14:08<33:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13718/15526 [4:14:09<33:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13718/15526 [4:14:09<33:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13719/15526 [4:14:09<33:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13719/15526 [4:14:09<33:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13720/15526 [4:14:10<33:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13720/15526 [4:14:10<33:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13721/15526 [4:14:11<33:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13721/15526 [4:14:11<33:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13722/15526 [4:14:11<33:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13722/15526 [4:14:11<33:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13723/15526 [4:14:12<33:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13723/15526 [4:14:12<33:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13724/15526 [4:14:13<33:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13724/15526 [4:14:13<33:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13725/15526 [4:14:14<33:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13725/15526 [4:14:14<33:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13726/15526 [4:14:15<33:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13726/15526 [4:14:15<33:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13727/15526 [4:14:15<33:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13727/15526 [4:14:15<33:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13728/15526 [4:14:25<33:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13728/15526 [4:14:25<33:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13729/15526 [4:14:26<33:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13729/15526 [4:14:26<33:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13730/15526 [4:14:27<33:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13730/15526 [4:14:27<33:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13731/15526 [4:14:28<33:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13731/15526 [4:14:28<33:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13732/15526 [4:14:28<33:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13732/15526 [4:14:28<33:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13733/15526 [4:14:29<33:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13733/15526 [4:14:29<33:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13734/15526 [4:14:30<33:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13734/15526 [4:14:30<33:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13735/15526 [4:14:31<33:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13735/15526 [4:14:31<33:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13736/15526 [4:14:32<33:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13736/15526 [4:14:32<33:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13737/15526 [4:14:33<33:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13737/15526 [4:14:33<33:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13738/15526 [4:14:34<33:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13738/15526 [4:14:34<33:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13739/15526 [4:14:35<33:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13739/15526 [4:14:35<33:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 13740/15526 [4:14:36<33:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  88%|▉| 13740/15526 [4:14:36<33:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13741/15526 [4:14:37<33:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13741/15526 [4:14:37<33:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13742/15526 [4:14:38<33:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13742/15526 [4:14:38<33:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13743/15526 [4:14:38<33:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13743/15526 [4:14:38<33:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13744/15526 [4:14:40<33:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13744/15526 [4:14:40<33:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13745/15526 [4:14:40<33:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13745/15526 [4:14:40<33:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13746/15526 [4:14:41<32:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13746/15526 [4:14:41<32:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13747/15526 [4:14:42<32:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13747/15526 [4:14:42<32:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13748/15526 [4:14:43<32:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13748/15526 [4:14:43<32:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13749/15526 [4:14:44<32:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13749/15526 [4:14:44<32:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13750/15526 [4:14:45<32:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13750/15526 [4:14:45<32:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13751/15526 [4:14:46<32:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13751/15526 [4:14:46<32:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13752/15526 [4:14:47<32:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13752/15526 [4:14:47<32:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13753/15526 [4:14:47<32:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13753/15526 [4:14:47<32:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13754/15526 [4:14:48<32:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13754/15526 [4:14:48<32:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13755/15526 [4:14:49<32:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13755/15526 [4:14:49<32:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13756/15526 [4:14:50<32:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13756/15526 [4:14:50<32:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13757/15526 [4:14:50<32:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13757/15526 [4:14:50<32:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13758/15526 [4:14:52<32:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13758/15526 [4:14:52<32:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13759/15526 [4:14:52<32:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13759/15526 [4:14:52<32:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13760/15526 [4:15:01<32:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13760/15526 [4:15:01<32:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13761/15526 [4:15:01<32:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13761/15526 [4:15:01<32:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13762/15526 [4:15:02<32:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13762/15526 [4:15:02<32:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13763/15526 [4:15:04<32:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13763/15526 [4:15:04<32:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13764/15526 [4:15:04<32:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13764/15526 [4:15:04<32:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13765/15526 [4:15:05<32:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13765/15526 [4:15:05<32:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13766/15526 [4:15:06<32:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13766/15526 [4:15:06<32:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13767/15526 [4:15:06<32:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13767/15526 [4:15:06<32:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13768/15526 [4:15:08<32:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13768/15526 [4:15:08<32:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13769/15526 [4:15:08<32:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13769/15526 [4:15:08<32:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13770/15526 [4:15:10<32:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13770/15526 [4:15:10<32:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13771/15526 [4:15:10<32:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13771/15526 [4:15:10<32:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13772/15526 [4:15:11<32:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13772/15526 [4:15:11<32:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13773/15526 [4:15:12<32:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13773/15526 [4:15:12<32:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13774/15526 [4:15:12<32:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13774/15526 [4:15:12<32:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13775/15526 [4:15:13<32:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13775/15526 [4:15:13<32:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13776/15526 [4:15:14<32:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13776/15526 [4:15:14<32:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13777/15526 [4:15:15<32:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13777/15526 [4:15:15<32:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13778/15526 [4:15:16<32:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13778/15526 [4:15:16<32:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13779/15526 [4:15:17<32:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13779/15526 [4:15:17<32:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13780/15526 [4:15:18<32:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13780/15526 [4:15:18<32:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13781/15526 [4:15:19<32:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13781/15526 [4:15:19<32:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13782/15526 [4:15:20<32:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13782/15526 [4:15:20<32:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13783/15526 [4:15:21<32:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13783/15526 [4:15:21<32:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13784/15526 [4:15:22<32:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13784/15526 [4:15:22<32:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13785/15526 [4:15:22<32:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13785/15526 [4:15:22<32:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13786/15526 [4:15:23<32:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13786/15526 [4:15:23<32:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13787/15526 [4:15:23<32:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13787/15526 [4:15:23<32:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13788/15526 [4:15:25<32:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13788/15526 [4:15:25<32:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13789/15526 [4:15:25<32:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13789/15526 [4:15:25<32:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13790/15526 [4:15:26<32:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13790/15526 [4:15:26<32:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13791/15526 [4:15:27<32:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13791/15526 [4:15:27<32:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13792/15526 [4:15:34<32:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13792/15526 [4:15:34<32:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13793/15526 [4:15:35<32:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13793/15526 [4:15:35<32:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13794/15526 [4:15:36<32:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13794/15526 [4:15:36<32:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13795/15526 [4:15:37<32:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13795/15526 [4:15:37<32:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13796/15526 [4:15:38<32:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13796/15526 [4:15:38<32:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13797/15526 [4:15:38<32:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13797/15526 [4:15:38<32:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13798/15526 [4:15:39<32:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13798/15526 [4:15:39<32:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13799/15526 [4:15:40<31:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13799/15526 [4:15:40<31:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13800/15526 [4:15:40<31:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13800/15526 [4:15:40<31:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13801/15526 [4:15:41<31:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13801/15526 [4:15:41<31:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13802/15526 [4:15:42<31:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13802/15526 [4:15:42<31:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13803/15526 [4:15:42<31:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13803/15526 [4:15:42<31:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13804/15526 [4:15:44<31:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13804/15526 [4:15:44<31:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13805/15526 [4:15:44<31:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13805/15526 [4:15:44<31:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13806/15526 [4:15:45<31:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13806/15526 [4:15:45<31:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13807/15526 [4:15:46<31:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13807/15526 [4:15:46<31:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13808/15526 [4:15:46<31:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13808/15526 [4:15:46<31:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13809/15526 [4:15:47<31:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13809/15526 [4:15:47<31:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13810/15526 [4:15:48<31:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13810/15526 [4:15:48<31:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13811/15526 [4:15:49<31:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13811/15526 [4:15:49<31:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13812/15526 [4:15:50<31:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13812/15526 [4:15:50<31:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13813/15526 [4:15:51<31:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13813/15526 [4:15:51<31:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13814/15526 [4:15:53<31:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13814/15526 [4:15:53<31:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13815/15526 [4:15:53<31:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13815/15526 [4:15:53<31:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13816/15526 [4:15:54<31:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13816/15526 [4:15:54<31:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13817/15526 [4:15:55<31:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13817/15526 [4:15:55<31:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13818/15526 [4:15:56<31:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13818/15526 [4:15:56<31:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13819/15526 [4:15:58<31:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13819/15526 [4:15:58<31:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13820/15526 [4:15:58<31:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13820/15526 [4:15:58<31:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13821/15526 [4:15:59<31:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13821/15526 [4:15:59<31:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13822/15526 [4:16:00<31:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13822/15526 [4:16:00<31:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13823/15526 [4:16:00<31:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13823/15526 [4:16:00<31:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13824/15526 [4:16:09<31:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13824/15526 [4:16:09<31:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13825/15526 [4:16:10<31:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13825/15526 [4:16:10<31:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13826/15526 [4:16:11<31:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13826/15526 [4:16:11<31:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13827/15526 [4:16:12<31:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13827/15526 [4:16:12<31:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13828/15526 [4:16:13<31:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13828/15526 [4:16:13<31:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13829/15526 [4:16:14<31:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13829/15526 [4:16:14<31:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13830/15526 [4:16:14<31:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13830/15526 [4:16:14<31:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13831/15526 [4:16:15<31:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13831/15526 [4:16:15<31:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13832/15526 [4:16:16<31:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13832/15526 [4:16:16<31:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13833/15526 [4:16:18<31:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13833/15526 [4:16:18<31:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13834/15526 [4:16:19<31:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13834/15526 [4:16:19<31:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13835/15526 [4:16:20<31:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13835/15526 [4:16:20<31:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13836/15526 [4:16:20<31:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13836/15526 [4:16:20<31:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13837/15526 [4:16:21<31:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13837/15526 [4:16:21<31:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13838/15526 [4:16:23<31:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13838/15526 [4:16:23<31:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13839/15526 [4:16:23<31:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13839/15526 [4:16:23<31:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13840/15526 [4:16:24<31:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13840/15526 [4:16:24<31:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13841/15526 [4:16:25<31:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13841/15526 [4:16:25<31:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13842/15526 [4:16:26<31:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13842/15526 [4:16:26<31:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13843/15526 [4:16:26<31:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13843/15526 [4:16:26<31:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13844/15526 [4:16:27<31:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13844/15526 [4:16:27<31:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13845/15526 [4:16:28<31:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13845/15526 [4:16:28<31:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13846/15526 [4:16:29<31:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13846/15526 [4:16:29<31:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13847/15526 [4:16:30<31:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13847/15526 [4:16:30<31:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13848/15526 [4:16:31<31:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13848/15526 [4:16:31<31:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13849/15526 [4:16:33<31:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13849/15526 [4:16:33<31:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13850/15526 [4:16:34<31:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13850/15526 [4:16:34<31:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13851/15526 [4:16:34<31:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13851/15526 [4:16:34<31:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13852/15526 [4:16:36<31:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13852/15526 [4:16:36<31:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13853/15526 [4:16:36<30:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13853/15526 [4:16:36<30:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13854/15526 [4:16:37<30:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13854/15526 [4:16:37<30:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13855/15526 [4:16:38<30:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13855/15526 [4:16:38<30:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13856/15526 [4:16:43<30:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13856/15526 [4:16:43<30:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13857/15526 [4:16:45<30:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13857/15526 [4:16:45<30:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13858/15526 [4:16:46<30:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13858/15526 [4:16:46<30:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13859/15526 [4:16:46<30:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13859/15526 [4:16:46<30:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13860/15526 [4:16:47<30:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13860/15526 [4:16:47<30:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13861/15526 [4:16:48<30:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13861/15526 [4:16:48<30:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13862/15526 [4:16:49<30:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13862/15526 [4:16:49<30:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13863/15526 [4:16:50<30:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13863/15526 [4:16:50<30:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13864/15526 [4:16:51<30:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13864/15526 [4:16:51<30:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13865/15526 [4:16:52<30:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13865/15526 [4:16:52<30:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13866/15526 [4:16:53<30:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13866/15526 [4:16:53<30:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13867/15526 [4:16:54<30:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13867/15526 [4:16:54<30:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13868/15526 [4:16:55<30:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13868/15526 [4:16:55<30:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13869/15526 [4:16:56<30:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13869/15526 [4:16:56<30:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13870/15526 [4:16:56<30:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13870/15526 [4:16:56<30:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13871/15526 [4:16:57<30:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13871/15526 [4:16:57<30:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13872/15526 [4:16:58<30:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13872/15526 [4:16:58<30:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13873/15526 [4:16:58<30:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13873/15526 [4:16:58<30:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13874/15526 [4:16:59<30:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13874/15526 [4:16:59<30:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13875/15526 [4:17:00<30:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13875/15526 [4:17:00<30:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13876/15526 [4:17:00<30:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13876/15526 [4:17:00<30:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13877/15526 [4:17:01<30:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13877/15526 [4:17:01<30:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13878/15526 [4:17:02<30:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13878/15526 [4:17:02<30:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13879/15526 [4:17:02<30:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13879/15526 [4:17:02<30:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13880/15526 [4:17:03<30:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13880/15526 [4:17:03<30:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13881/15526 [4:17:05<30:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13881/15526 [4:17:05<30:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13882/15526 [4:17:05<30:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13882/15526 [4:17:05<30:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13883/15526 [4:17:06<30:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13883/15526 [4:17:06<30:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13884/15526 [4:17:07<30:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13884/15526 [4:17:07<30:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13885/15526 [4:17:08<30:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13885/15526 [4:17:08<30:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13886/15526 [4:17:09<30:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13886/15526 [4:17:09<30:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13887/15526 [4:17:10<30:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13887/15526 [4:17:10<30:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13888/15526 [4:17:17<30:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13888/15526 [4:17:17<30:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13889/15526 [4:17:17<30:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13889/15526 [4:17:17<30:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13890/15526 [4:17:18<30:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13890/15526 [4:17:18<30:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13891/15526 [4:17:19<30:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13891/15526 [4:17:19<30:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13892/15526 [4:17:19<30:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13892/15526 [4:17:19<30:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13893/15526 [4:17:20<30:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13893/15526 [4:17:20<30:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13894/15526 [4:17:21<30:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13894/15526 [4:17:21<30:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 13895/15526 [4:17:21<30:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  89%|▉| 13895/15526 [4:17:21<30:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13896/15526 [4:17:22<30:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13896/15526 [4:17:22<30:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13897/15526 [4:17:23<30:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13897/15526 [4:17:23<30:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13898/15526 [4:17:24<30:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13898/15526 [4:17:24<30:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13899/15526 [4:17:24<30:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13899/15526 [4:17:24<30:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13900/15526 [4:17:26<30:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13900/15526 [4:17:26<30:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13901/15526 [4:17:26<30:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13901/15526 [4:17:26<30:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13902/15526 [4:17:27<30:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13902/15526 [4:17:27<30:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13903/15526 [4:17:28<30:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13903/15526 [4:17:28<30:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13904/15526 [4:17:28<30:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13904/15526 [4:17:28<30:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13905/15526 [4:17:29<30:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13905/15526 [4:17:29<30:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13906/15526 [4:17:30<29:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13906/15526 [4:17:30<29:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13907/15526 [4:17:30<29:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13907/15526 [4:17:30<29:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13908/15526 [4:17:31<29:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13908/15526 [4:17:31<29:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13909/15526 [4:17:32<29:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13909/15526 [4:17:32<29:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13910/15526 [4:17:33<29:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13910/15526 [4:17:33<29:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13911/15526 [4:17:34<29:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13911/15526 [4:17:34<29:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13912/15526 [4:17:35<29:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13912/15526 [4:17:35<29:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13913/15526 [4:17:36<29:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13913/15526 [4:17:36<29:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13914/15526 [4:17:37<29:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13914/15526 [4:17:37<29:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13915/15526 [4:17:38<29:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13915/15526 [4:17:38<29:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13916/15526 [4:17:39<29:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13916/15526 [4:17:39<29:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13917/15526 [4:17:40<29:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13917/15526 [4:17:40<29:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13918/15526 [4:17:41<29:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13918/15526 [4:17:41<29:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13919/15526 [4:17:41<29:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13919/15526 [4:17:41<29:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13920/15526 [4:17:51<29:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13920/15526 [4:17:51<29:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13921/15526 [4:17:52<29:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13921/15526 [4:17:52<29:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13922/15526 [4:17:53<29:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13922/15526 [4:17:53<29:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13923/15526 [4:17:54<29:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13923/15526 [4:17:54<29:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13924/15526 [4:17:55<29:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13924/15526 [4:17:55<29:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13925/15526 [4:17:56<29:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13925/15526 [4:17:56<29:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13926/15526 [4:17:57<29:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13926/15526 [4:17:57<29:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13927/15526 [4:17:57<29:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13927/15526 [4:17:57<29:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13928/15526 [4:17:58<29:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13928/15526 [4:17:58<29:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13929/15526 [4:17:59<29:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13929/15526 [4:17:59<29:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13930/15526 [4:18:00<29:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13930/15526 [4:18:00<29:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13931/15526 [4:18:01<29:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13931/15526 [4:18:01<29:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13932/15526 [4:18:02<29:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13932/15526 [4:18:02<29:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13933/15526 [4:18:02<29:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13933/15526 [4:18:02<29:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13934/15526 [4:18:03<29:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13934/15526 [4:18:03<29:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13935/15526 [4:18:05<29:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13935/15526 [4:18:05<29:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13936/15526 [4:18:05<29:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13936/15526 [4:18:05<29:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13937/15526 [4:18:06<29:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13937/15526 [4:18:06<29:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13938/15526 [4:18:07<29:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13938/15526 [4:18:07<29:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13939/15526 [4:18:08<29:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13939/15526 [4:18:08<29:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13940/15526 [4:18:09<29:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13940/15526 [4:18:09<29:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13941/15526 [4:18:10<29:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13941/15526 [4:18:10<29:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13942/15526 [4:18:11<29:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13942/15526 [4:18:11<29:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13943/15526 [4:18:11<29:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13943/15526 [4:18:11<29:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13944/15526 [4:18:12<29:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13944/15526 [4:18:12<29:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13945/15526 [4:18:13<29:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13945/15526 [4:18:13<29:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13946/15526 [4:18:13<29:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13946/15526 [4:18:13<29:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13947/15526 [4:18:14<29:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13947/15526 [4:18:14<29:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13948/15526 [4:18:15<29:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13948/15526 [4:18:15<29:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13949/15526 [4:18:16<29:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13949/15526 [4:18:16<29:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13950/15526 [4:18:17<29:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13950/15526 [4:18:17<29:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13951/15526 [4:18:17<29:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13951/15526 [4:18:17<29:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13952/15526 [4:18:26<29:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13952/15526 [4:18:26<29:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13953/15526 [4:18:27<29:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13953/15526 [4:18:27<29:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13954/15526 [4:18:28<29:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13954/15526 [4:18:28<29:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13955/15526 [4:18:29<29:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13955/15526 [4:18:29<29:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13956/15526 [4:18:29<29:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13956/15526 [4:18:29<29:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13957/15526 [4:18:31<29:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13957/15526 [4:18:31<29:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13958/15526 [4:18:31<29:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13958/15526 [4:18:31<29:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13959/15526 [4:18:32<29:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13959/15526 [4:18:32<29:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13960/15526 [4:18:34<29:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13960/15526 [4:18:34<29:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13961/15526 [4:18:34<28:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13961/15526 [4:18:34<28:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13962/15526 [4:18:35<28:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13962/15526 [4:18:35<28:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13963/15526 [4:18:36<28:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13963/15526 [4:18:36<28:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13964/15526 [4:18:37<28:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13964/15526 [4:18:37<28:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13965/15526 [4:18:38<28:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13965/15526 [4:18:38<28:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13966/15526 [4:18:38<28:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13966/15526 [4:18:38<28:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13967/15526 [4:18:39<28:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13967/15526 [4:18:39<28:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13968/15526 [4:18:40<28:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13968/15526 [4:18:40<28:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13969/15526 [4:18:41<28:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13969/15526 [4:18:41<28:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13970/15526 [4:18:42<28:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13970/15526 [4:18:42<28:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13971/15526 [4:18:42<28:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13971/15526 [4:18:42<28:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13972/15526 [4:18:43<28:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13972/15526 [4:18:43<28:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13973/15526 [4:18:45<28:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13973/15526 [4:18:45<28:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13974/15526 [4:18:45<28:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13974/15526 [4:18:45<28:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13975/15526 [4:18:47<28:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13975/15526 [4:18:47<28:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13976/15526 [4:18:47<28:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13976/15526 [4:18:47<28:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13977/15526 [4:18:48<28:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13977/15526 [4:18:48<28:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13978/15526 [4:18:49<28:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13978/15526 [4:18:49<28:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13979/15526 [4:18:50<28:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13979/15526 [4:18:50<28:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13980/15526 [4:18:51<28:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13980/15526 [4:18:51<28:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13981/15526 [4:18:51<28:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13981/15526 [4:18:51<28:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13982/15526 [4:18:52<28:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13982/15526 [4:18:52<28:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13983/15526 [4:18:54<28:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13983/15526 [4:18:54<28:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13984/15526 [4:19:01<28:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13984/15526 [4:19:01<28:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13985/15526 [4:19:02<28:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13985/15526 [4:19:02<28:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13986/15526 [4:19:03<28:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13986/15526 [4:19:03<28:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13987/15526 [4:19:03<28:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13987/15526 [4:19:03<28:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13988/15526 [4:19:04<28:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13988/15526 [4:19:04<28:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13989/15526 [4:19:05<28:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13989/15526 [4:19:05<28:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13990/15526 [4:19:05<28:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13990/15526 [4:19:05<28:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13991/15526 [4:19:07<28:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13991/15526 [4:19:07<28:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13992/15526 [4:19:07<28:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13992/15526 [4:19:07<28:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13993/15526 [4:19:08<28:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13993/15526 [4:19:08<28:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13994/15526 [4:19:10<28:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13994/15526 [4:19:10<28:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13995/15526 [4:19:11<28:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13995/15526 [4:19:11<28:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13996/15526 [4:19:12<28:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13996/15526 [4:19:12<28:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13997/15526 [4:19:13<28:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13997/15526 [4:19:13<28:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13998/15526 [4:19:13<28:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 13998/15526 [4:19:13<28:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13999/15526 [4:19:14<28:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 13999/15526 [4:19:14<28:16,  1.11s/it, v_num=73vx, train/loss=9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14000/15526 [4:19:15<28:15,  1.11s/it, v_num=73vx, train/loss=9\r",
-      "Epoch 0:  90%|▉| 14000/15526 [4:19:15<28:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14001/15526 [4:19:16<28:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14001/15526 [4:19:16<28:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14002/15526 [4:19:17<28:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14002/15526 [4:19:17<28:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14003/15526 [4:19:18<28:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14003/15526 [4:19:18<28:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14004/15526 [4:19:19<28:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14004/15526 [4:19:19<28:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14005/15526 [4:19:19<28:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14005/15526 [4:19:19<28:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14006/15526 [4:19:20<28:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14006/15526 [4:19:20<28:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14007/15526 [4:19:21<28:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14007/15526 [4:19:21<28:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14008/15526 [4:19:22<28:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14008/15526 [4:19:22<28:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14009/15526 [4:19:23<28:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14009/15526 [4:19:23<28:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14010/15526 [4:19:24<28:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14010/15526 [4:19:24<28:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14011/15526 [4:19:25<28:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14011/15526 [4:19:25<28:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14012/15526 [4:19:26<28:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14012/15526 [4:19:26<28:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14013/15526 [4:19:27<28:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14013/15526 [4:19:27<28:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14014/15526 [4:19:28<27:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14014/15526 [4:19:28<27:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14015/15526 [4:19:29<27:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14015/15526 [4:19:29<27:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14016/15526 [4:19:35<27:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14016/15526 [4:19:35<27:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14017/15526 [4:19:36<27:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14017/15526 [4:19:36<27:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14018/15526 [4:19:37<27:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14018/15526 [4:19:37<27:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14019/15526 [4:19:37<27:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14019/15526 [4:19:37<27:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14020/15526 [4:19:39<27:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14020/15526 [4:19:39<27:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14021/15526 [4:19:39<27:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14021/15526 [4:19:39<27:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14022/15526 [4:19:41<27:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14022/15526 [4:19:41<27:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14023/15526 [4:19:41<27:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14023/15526 [4:19:41<27:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14024/15526 [4:19:42<27:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14024/15526 [4:19:42<27:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14025/15526 [4:19:43<27:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14025/15526 [4:19:43<27:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14026/15526 [4:19:43<27:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14026/15526 [4:19:43<27:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14027/15526 [4:19:44<27:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14027/15526 [4:19:44<27:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14028/15526 [4:19:45<27:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14028/15526 [4:19:45<27:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14029/15526 [4:19:45<27:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14029/15526 [4:19:45<27:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14030/15526 [4:19:46<27:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14030/15526 [4:19:46<27:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14031/15526 [4:19:47<27:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14031/15526 [4:19:47<27:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14032/15526 [4:19:48<27:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14032/15526 [4:19:48<27:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14033/15526 [4:19:49<27:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14033/15526 [4:19:49<27:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14034/15526 [4:19:50<27:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14034/15526 [4:19:50<27:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14035/15526 [4:19:51<27:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14035/15526 [4:19:51<27:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14036/15526 [4:19:52<27:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14036/15526 [4:19:52<27:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14037/15526 [4:19:52<27:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14037/15526 [4:19:52<27:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14038/15526 [4:19:53<27:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14038/15526 [4:19:53<27:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14039/15526 [4:19:54<27:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14039/15526 [4:19:54<27:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14040/15526 [4:19:55<27:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14040/15526 [4:19:55<27:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14041/15526 [4:19:56<27:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14041/15526 [4:19:56<27:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14042/15526 [4:19:57<27:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14042/15526 [4:19:57<27:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14043/15526 [4:19:58<27:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14043/15526 [4:19:58<27:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14044/15526 [4:19:58<27:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14044/15526 [4:19:58<27:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14045/15526 [4:19:59<27:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14045/15526 [4:19:59<27:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14046/15526 [4:20:00<27:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14046/15526 [4:20:00<27:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14047/15526 [4:20:01<27:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14047/15526 [4:20:01<27:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14048/15526 [4:20:10<27:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14048/15526 [4:20:10<27:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14049/15526 [4:20:11<27:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14049/15526 [4:20:11<27:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14050/15526 [4:20:11<27:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14050/15526 [4:20:11<27:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 14051/15526 [4:20:12<27:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  90%|▉| 14051/15526 [4:20:12<27:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14052/15526 [4:20:13<27:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14052/15526 [4:20:13<27:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14053/15526 [4:20:14<27:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14053/15526 [4:20:14<27:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14054/15526 [4:20:15<27:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14054/15526 [4:20:15<27:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14055/15526 [4:20:16<27:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14055/15526 [4:20:16<27:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14056/15526 [4:20:17<27:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14056/15526 [4:20:17<27:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14057/15526 [4:20:18<27:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14057/15526 [4:20:18<27:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14058/15526 [4:20:18<27:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14058/15526 [4:20:18<27:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14059/15526 [4:20:19<27:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14059/15526 [4:20:19<27:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14060/15526 [4:20:20<27:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14060/15526 [4:20:20<27:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14061/15526 [4:20:20<27:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14061/15526 [4:20:20<27:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14062/15526 [4:20:22<27:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14062/15526 [4:20:22<27:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14063/15526 [4:20:22<27:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14063/15526 [4:20:22<27:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14064/15526 [4:20:24<27:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14064/15526 [4:20:24<27:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14065/15526 [4:20:24<27:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14065/15526 [4:20:24<27:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14066/15526 [4:20:25<27:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14066/15526 [4:20:25<27:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14067/15526 [4:20:26<27:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14067/15526 [4:20:26<27:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14068/15526 [4:20:27<26:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14068/15526 [4:20:27<26:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14069/15526 [4:20:28<26:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14069/15526 [4:20:28<26:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14070/15526 [4:20:29<26:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14070/15526 [4:20:29<26:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14071/15526 [4:20:30<26:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14071/15526 [4:20:30<26:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14072/15526 [4:20:31<26:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14072/15526 [4:20:31<26:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14073/15526 [4:20:32<26:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14073/15526 [4:20:32<26:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14074/15526 [4:20:34<26:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14074/15526 [4:20:34<26:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14075/15526 [4:20:34<26:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14075/15526 [4:20:34<26:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14076/15526 [4:20:35<26:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14076/15526 [4:20:35<26:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14077/15526 [4:20:36<26:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14077/15526 [4:20:36<26:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14078/15526 [4:20:37<26:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14078/15526 [4:20:37<26:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14079/15526 [4:20:38<26:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14079/15526 [4:20:38<26:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14080/15526 [4:20:44<26:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14080/15526 [4:20:44<26:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14081/15526 [4:20:45<26:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14081/15526 [4:20:45<26:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14082/15526 [4:20:46<26:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14082/15526 [4:20:46<26:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14083/15526 [4:20:47<26:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14083/15526 [4:20:47<26:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14084/15526 [4:20:48<26:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14084/15526 [4:20:48<26:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14085/15526 [4:20:48<26:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14085/15526 [4:20:48<26:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14086/15526 [4:20:49<26:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14086/15526 [4:20:49<26:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14087/15526 [4:20:50<26:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14087/15526 [4:20:50<26:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14088/15526 [4:20:51<26:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14088/15526 [4:20:51<26:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14089/15526 [4:20:51<26:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14089/15526 [4:20:51<26:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14090/15526 [4:20:52<26:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14090/15526 [4:20:52<26:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14091/15526 [4:20:54<26:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14091/15526 [4:20:54<26:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14092/15526 [4:20:54<26:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14092/15526 [4:20:54<26:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14093/15526 [4:20:55<26:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14093/15526 [4:20:55<26:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14094/15526 [4:20:56<26:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14094/15526 [4:20:56<26:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14095/15526 [4:20:56<26:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14095/15526 [4:20:56<26:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14096/15526 [4:20:57<26:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14096/15526 [4:20:57<26:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14097/15526 [4:20:58<26:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14097/15526 [4:20:58<26:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14098/15526 [4:20:59<26:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14098/15526 [4:20:59<26:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14099/15526 [4:21:00<26:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14099/15526 [4:21:00<26:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14100/15526 [4:21:00<26:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14100/15526 [4:21:00<26:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14101/15526 [4:21:02<26:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14101/15526 [4:21:02<26:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14102/15526 [4:21:02<26:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14102/15526 [4:21:02<26:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14103/15526 [4:21:03<26:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14103/15526 [4:21:03<26:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14104/15526 [4:21:04<26:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14104/15526 [4:21:04<26:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14105/15526 [4:21:05<26:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14105/15526 [4:21:05<26:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14106/15526 [4:21:06<26:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14106/15526 [4:21:06<26:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14107/15526 [4:21:07<26:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14107/15526 [4:21:07<26:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14108/15526 [4:21:08<26:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14108/15526 [4:21:08<26:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14109/15526 [4:21:09<26:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14109/15526 [4:21:09<26:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14110/15526 [4:21:10<26:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14110/15526 [4:21:10<26:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14111/15526 [4:21:10<26:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14111/15526 [4:21:10<26:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14112/15526 [4:21:17<26:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14112/15526 [4:21:17<26:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14113/15526 [4:21:18<26:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14113/15526 [4:21:18<26:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14114/15526 [4:21:19<26:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14114/15526 [4:21:19<26:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14115/15526 [4:21:21<26:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14115/15526 [4:21:21<26:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14116/15526 [4:21:22<26:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14116/15526 [4:21:22<26:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14117/15526 [4:21:22<26:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14117/15526 [4:21:22<26:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14118/15526 [4:21:24<26:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14118/15526 [4:21:24<26:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14119/15526 [4:21:25<26:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14119/15526 [4:21:25<26:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14120/15526 [4:21:26<26:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14120/15526 [4:21:26<26:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14121/15526 [4:21:27<26:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14121/15526 [4:21:27<26:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14122/15526 [4:21:27<25:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14122/15526 [4:21:27<25:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14123/15526 [4:21:28<25:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14123/15526 [4:21:28<25:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14124/15526 [4:21:29<25:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14124/15526 [4:21:29<25:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14125/15526 [4:21:30<25:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14125/15526 [4:21:30<25:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14126/15526 [4:21:30<25:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14126/15526 [4:21:30<25:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14127/15526 [4:21:31<25:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14127/15526 [4:21:31<25:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14128/15526 [4:21:32<25:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14128/15526 [4:21:32<25:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14129/15526 [4:21:32<25:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14129/15526 [4:21:32<25:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14130/15526 [4:21:33<25:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14130/15526 [4:21:33<25:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14131/15526 [4:21:34<25:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14131/15526 [4:21:34<25:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14132/15526 [4:21:35<25:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14132/15526 [4:21:35<25:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14133/15526 [4:21:35<25:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14133/15526 [4:21:35<25:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14134/15526 [4:21:36<25:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14134/15526 [4:21:36<25:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14135/15526 [4:21:37<25:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14135/15526 [4:21:37<25:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14136/15526 [4:21:37<25:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14136/15526 [4:21:37<25:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14137/15526 [4:21:39<25:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14137/15526 [4:21:39<25:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14138/15526 [4:21:39<25:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14138/15526 [4:21:39<25:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14139/15526 [4:21:40<25:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14139/15526 [4:21:40<25:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14140/15526 [4:21:41<25:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14140/15526 [4:21:41<25:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14141/15526 [4:21:41<25:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14141/15526 [4:21:41<25:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14142/15526 [4:21:42<25:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14142/15526 [4:21:42<25:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14143/15526 [4:21:43<25:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14143/15526 [4:21:43<25:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14144/15526 [4:21:52<25:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14144/15526 [4:21:52<25:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14145/15526 [4:21:53<25:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14145/15526 [4:21:53<25:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14146/15526 [4:21:54<25:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14146/15526 [4:21:54<25:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14147/15526 [4:21:55<25:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14147/15526 [4:21:55<25:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14148/15526 [4:21:56<25:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14148/15526 [4:21:56<25:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14149/15526 [4:21:56<25:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14149/15526 [4:21:56<25:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14150/15526 [4:21:57<25:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14150/15526 [4:21:57<25:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14151/15526 [4:21:58<25:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14151/15526 [4:21:58<25:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14152/15526 [4:21:59<25:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14152/15526 [4:21:59<25:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14153/15526 [4:22:00<25:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14153/15526 [4:22:00<25:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14154/15526 [4:22:01<25:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14154/15526 [4:22:01<25:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14155/15526 [4:22:01<25:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14155/15526 [4:22:01<25:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14156/15526 [4:22:02<25:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14156/15526 [4:22:02<25:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14157/15526 [4:22:03<25:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14157/15526 [4:22:03<25:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14158/15526 [4:22:04<25:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14158/15526 [4:22:04<25:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14159/15526 [4:22:05<25:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14159/15526 [4:22:05<25:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14160/15526 [4:22:06<25:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14160/15526 [4:22:06<25:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14161/15526 [4:22:06<25:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14161/15526 [4:22:06<25:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14162/15526 [4:22:07<25:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14162/15526 [4:22:07<25:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14163/15526 [4:22:08<25:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14163/15526 [4:22:08<25:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14164/15526 [4:22:09<25:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14164/15526 [4:22:09<25:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14165/15526 [4:22:10<25:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14165/15526 [4:22:10<25:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14166/15526 [4:22:11<25:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14166/15526 [4:22:11<25:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14167/15526 [4:22:12<25:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14167/15526 [4:22:12<25:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14168/15526 [4:22:13<25:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14168/15526 [4:22:13<25:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14169/15526 [4:22:13<25:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14169/15526 [4:22:13<25:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14170/15526 [4:22:14<25:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14170/15526 [4:22:14<25:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14171/15526 [4:22:15<25:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14171/15526 [4:22:15<25:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14172/15526 [4:22:15<25:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14172/15526 [4:22:15<25:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14173/15526 [4:22:17<25:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14173/15526 [4:22:17<25:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14174/15526 [4:22:17<25:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14174/15526 [4:22:17<25:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14175/15526 [4:22:18<25:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14175/15526 [4:22:18<25:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14176/15526 [4:22:26<24:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14176/15526 [4:22:26<24:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14177/15526 [4:22:27<24:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14177/15526 [4:22:27<24:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14178/15526 [4:22:27<24:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14178/15526 [4:22:27<24:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14179/15526 [4:22:28<24:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14179/15526 [4:22:28<24:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14180/15526 [4:22:29<24:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14180/15526 [4:22:29<24:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14181/15526 [4:22:29<24:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14181/15526 [4:22:29<24:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14182/15526 [4:22:30<24:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14182/15526 [4:22:30<24:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14183/15526 [4:22:31<24:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14183/15526 [4:22:31<24:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14184/15526 [4:22:32<24:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14184/15526 [4:22:32<24:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14185/15526 [4:22:33<24:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14185/15526 [4:22:33<24:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14186/15526 [4:22:34<24:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14186/15526 [4:22:34<24:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14187/15526 [4:22:36<24:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14187/15526 [4:22:36<24:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14188/15526 [4:22:36<24:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14188/15526 [4:22:36<24:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14189/15526 [4:22:37<24:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14189/15526 [4:22:37<24:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14190/15526 [4:22:39<24:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14190/15526 [4:22:39<24:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14191/15526 [4:22:39<24:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14191/15526 [4:22:39<24:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14192/15526 [4:22:40<24:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14192/15526 [4:22:40<24:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14193/15526 [4:22:41<24:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14193/15526 [4:22:41<24:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14194/15526 [4:22:42<24:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14194/15526 [4:22:42<24:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14195/15526 [4:22:43<24:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14195/15526 [4:22:43<24:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14196/15526 [4:22:44<24:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14196/15526 [4:22:44<24:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14197/15526 [4:22:45<24:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14197/15526 [4:22:45<24:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14198/15526 [4:22:46<24:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14198/15526 [4:22:46<24:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14199/15526 [4:22:47<24:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14199/15526 [4:22:47<24:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14200/15526 [4:22:47<24:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14200/15526 [4:22:47<24:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14201/15526 [4:22:49<24:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14201/15526 [4:22:49<24:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14202/15526 [4:22:50<24:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14202/15526 [4:22:50<24:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14203/15526 [4:22:51<24:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14203/15526 [4:22:51<24:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14204/15526 [4:22:51<24:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14204/15526 [4:22:51<24:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14205/15526 [4:22:52<24:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14205/15526 [4:22:52<24:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 14206/15526 [4:22:53<24:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  91%|▉| 14206/15526 [4:22:53<24:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14207/15526 [4:22:54<24:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14207/15526 [4:22:54<24:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14208/15526 [4:23:00<24:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14208/15526 [4:23:00<24:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14209/15526 [4:23:01<24:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14209/15526 [4:23:01<24:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14210/15526 [4:23:02<24:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14210/15526 [4:23:02<24:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14211/15526 [4:23:03<24:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14211/15526 [4:23:03<24:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14212/15526 [4:23:04<24:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14212/15526 [4:23:04<24:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14213/15526 [4:23:04<24:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14213/15526 [4:23:04<24:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14214/15526 [4:23:05<24:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14214/15526 [4:23:05<24:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14215/15526 [4:23:07<24:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14215/15526 [4:23:07<24:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14216/15526 [4:23:07<24:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14216/15526 [4:23:07<24:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14217/15526 [4:23:08<24:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14217/15526 [4:23:08<24:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14218/15526 [4:23:09<24:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14218/15526 [4:23:09<24:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14219/15526 [4:23:10<24:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14219/15526 [4:23:10<24:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14220/15526 [4:23:11<24:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14220/15526 [4:23:11<24:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14221/15526 [4:23:11<24:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14221/15526 [4:23:11<24:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14222/15526 [4:23:12<24:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14222/15526 [4:23:12<24:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14223/15526 [4:23:13<24:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14223/15526 [4:23:13<24:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14224/15526 [4:23:14<24:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14224/15526 [4:23:14<24:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14225/15526 [4:23:15<24:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14225/15526 [4:23:15<24:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14226/15526 [4:23:16<24:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14226/15526 [4:23:16<24:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14227/15526 [4:23:17<24:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14227/15526 [4:23:17<24:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14228/15526 [4:23:18<24:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14228/15526 [4:23:18<24:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14229/15526 [4:23:19<24:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14229/15526 [4:23:19<24:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14230/15526 [4:23:20<23:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14230/15526 [4:23:20<23:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14231/15526 [4:23:21<23:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14231/15526 [4:23:21<23:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14232/15526 [4:23:21<23:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14232/15526 [4:23:21<23:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14233/15526 [4:23:22<23:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14233/15526 [4:23:22<23:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14234/15526 [4:23:23<23:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14234/15526 [4:23:23<23:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14235/15526 [4:23:24<23:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14235/15526 [4:23:24<23:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14236/15526 [4:23:25<23:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14236/15526 [4:23:25<23:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14237/15526 [4:23:26<23:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14237/15526 [4:23:26<23:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14238/15526 [4:23:26<23:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14238/15526 [4:23:26<23:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14239/15526 [4:23:27<23:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14239/15526 [4:23:27<23:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14240/15526 [4:23:33<23:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14240/15526 [4:23:33<23:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14241/15526 [4:23:34<23:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14241/15526 [4:23:34<23:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14242/15526 [4:23:35<23:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14242/15526 [4:23:35<23:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14243/15526 [4:23:36<23:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14243/15526 [4:23:36<23:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14244/15526 [4:23:37<23:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14244/15526 [4:23:37<23:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14245/15526 [4:23:39<23:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14245/15526 [4:23:39<23:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14246/15526 [4:23:40<23:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14246/15526 [4:23:40<23:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14247/15526 [4:23:41<23:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14247/15526 [4:23:41<23:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14248/15526 [4:23:41<23:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14248/15526 [4:23:41<23:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14249/15526 [4:23:42<23:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14249/15526 [4:23:42<23:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14250/15526 [4:23:43<23:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14250/15526 [4:23:43<23:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14251/15526 [4:23:43<23:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14251/15526 [4:23:43<23:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14252/15526 [4:23:44<23:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14252/15526 [4:23:44<23:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14253/15526 [4:23:46<23:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14253/15526 [4:23:46<23:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14254/15526 [4:23:46<23:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14254/15526 [4:23:46<23:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14255/15526 [4:23:47<23:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14255/15526 [4:23:47<23:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14256/15526 [4:23:48<23:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14256/15526 [4:23:48<23:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14257/15526 [4:23:48<23:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14257/15526 [4:23:48<23:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14258/15526 [4:23:49<23:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14258/15526 [4:23:49<23:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14259/15526 [4:23:50<23:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14259/15526 [4:23:50<23:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14260/15526 [4:23:52<23:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14260/15526 [4:23:52<23:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14261/15526 [4:23:52<23:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14261/15526 [4:23:52<23:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14262/15526 [4:23:53<23:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14262/15526 [4:23:53<23:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14263/15526 [4:23:55<23:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14263/15526 [4:23:55<23:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14264/15526 [4:23:55<23:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14264/15526 [4:23:55<23:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14265/15526 [4:23:56<23:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14265/15526 [4:23:56<23:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14266/15526 [4:23:57<23:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14266/15526 [4:23:57<23:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14267/15526 [4:23:58<23:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14267/15526 [4:23:58<23:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14268/15526 [4:24:00<23:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14268/15526 [4:24:00<23:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14269/15526 [4:24:00<23:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14269/15526 [4:24:00<23:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14270/15526 [4:24:01<23:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14270/15526 [4:24:01<23:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14271/15526 [4:24:02<23:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14271/15526 [4:24:02<23:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14272/15526 [4:24:08<23:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14272/15526 [4:24:08<23:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14273/15526 [4:24:09<23:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14273/15526 [4:24:09<23:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14274/15526 [4:24:09<23:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14274/15526 [4:24:09<23:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14275/15526 [4:24:10<23:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14275/15526 [4:24:10<23:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14276/15526 [4:24:11<23:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14276/15526 [4:24:11<23:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14277/15526 [4:24:12<23:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14277/15526 [4:24:12<23:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14278/15526 [4:24:13<23:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14278/15526 [4:24:13<23:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14279/15526 [4:24:13<23:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14279/15526 [4:24:13<23:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14280/15526 [4:24:14<23:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14280/15526 [4:24:14<23:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14281/15526 [4:24:15<23:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14281/15526 [4:24:15<23:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14282/15526 [4:24:15<23:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14282/15526 [4:24:15<23:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14283/15526 [4:24:17<22:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14283/15526 [4:24:17<22:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14284/15526 [4:24:17<22:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14284/15526 [4:24:17<22:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14285/15526 [4:24:18<22:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14285/15526 [4:24:18<22:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14286/15526 [4:24:19<22:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14286/15526 [4:24:19<22:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14287/15526 [4:24:20<22:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14287/15526 [4:24:20<22:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14288/15526 [4:24:21<22:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14288/15526 [4:24:21<22:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14289/15526 [4:24:22<22:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14289/15526 [4:24:22<22:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14290/15526 [4:24:23<22:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14290/15526 [4:24:23<22:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14291/15526 [4:24:24<22:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14291/15526 [4:24:24<22:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14292/15526 [4:24:25<22:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14292/15526 [4:24:25<22:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14293/15526 [4:24:26<22:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14293/15526 [4:24:26<22:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14294/15526 [4:24:27<22:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14294/15526 [4:24:27<22:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14295/15526 [4:24:28<22:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14295/15526 [4:24:28<22:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14296/15526 [4:24:28<22:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14296/15526 [4:24:28<22:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14297/15526 [4:24:30<22:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14297/15526 [4:24:30<22:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14298/15526 [4:24:30<22:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14298/15526 [4:24:30<22:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14299/15526 [4:24:31<22:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14299/15526 [4:24:31<22:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14300/15526 [4:24:32<22:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14300/15526 [4:24:32<22:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14301/15526 [4:24:33<22:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14301/15526 [4:24:33<22:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14302/15526 [4:24:34<22:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14302/15526 [4:24:34<22:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14303/15526 [4:24:35<22:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14303/15526 [4:24:35<22:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14304/15526 [4:24:45<22:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14304/15526 [4:24:45<22:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14305/15526 [4:24:45<22:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14305/15526 [4:24:45<22:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14306/15526 [4:24:46<22:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14306/15526 [4:24:46<22:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14307/15526 [4:24:47<22:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14307/15526 [4:24:47<22:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14308/15526 [4:24:48<22:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14308/15526 [4:24:48<22:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14309/15526 [4:24:49<22:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14309/15526 [4:24:49<22:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14310/15526 [4:24:49<22:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14310/15526 [4:24:49<22:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14311/15526 [4:24:50<22:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14311/15526 [4:24:50<22:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14312/15526 [4:24:51<22:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14312/15526 [4:24:51<22:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14313/15526 [4:24:52<22:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14313/15526 [4:24:52<22:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14314/15526 [4:24:52<22:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14314/15526 [4:24:52<22:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14315/15526 [4:24:53<22:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14315/15526 [4:24:53<22:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14316/15526 [4:24:54<22:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14316/15526 [4:24:54<22:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14317/15526 [4:24:55<22:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14317/15526 [4:24:55<22:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14318/15526 [4:24:56<22:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14318/15526 [4:24:56<22:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14319/15526 [4:24:57<22:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14319/15526 [4:24:57<22:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14320/15526 [4:24:58<22:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14320/15526 [4:24:58<22:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14321/15526 [4:24:59<22:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14321/15526 [4:24:59<22:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14322/15526 [4:25:00<22:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14322/15526 [4:25:00<22:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14323/15526 [4:25:01<22:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14323/15526 [4:25:01<22:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14324/15526 [4:25:02<22:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14324/15526 [4:25:02<22:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14325/15526 [4:25:03<22:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14325/15526 [4:25:03<22:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14326/15526 [4:25:04<22:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14326/15526 [4:25:04<22:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14327/15526 [4:25:04<22:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14327/15526 [4:25:04<22:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14328/15526 [4:25:05<22:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14328/15526 [4:25:05<22:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14329/15526 [4:25:06<22:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14329/15526 [4:25:06<22:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14330/15526 [4:25:07<22:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14330/15526 [4:25:07<22:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14331/15526 [4:25:08<22:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14331/15526 [4:25:08<22:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14332/15526 [4:25:09<22:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14332/15526 [4:25:09<22:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14333/15526 [4:25:10<22:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14333/15526 [4:25:10<22:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14334/15526 [4:25:11<22:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14334/15526 [4:25:11<22:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14335/15526 [4:25:12<22:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14335/15526 [4:25:12<22:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14336/15526 [4:25:19<22:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14336/15526 [4:25:19<22:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14337/15526 [4:25:20<22:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14337/15526 [4:25:20<22:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14338/15526 [4:25:21<21:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14338/15526 [4:25:21<21:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14339/15526 [4:25:22<21:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14339/15526 [4:25:22<21:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14340/15526 [4:25:23<21:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14340/15526 [4:25:23<21:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14341/15526 [4:25:23<21:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14341/15526 [4:25:23<21:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14342/15526 [4:25:24<21:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14342/15526 [4:25:24<21:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14343/15526 [4:25:25<21:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14343/15526 [4:25:25<21:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14344/15526 [4:25:25<21:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14344/15526 [4:25:25<21:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14345/15526 [4:25:26<21:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14345/15526 [4:25:26<21:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14346/15526 [4:25:27<21:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14346/15526 [4:25:27<21:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14347/15526 [4:25:27<21:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14347/15526 [4:25:27<21:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14348/15526 [4:25:28<21:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14348/15526 [4:25:28<21:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14349/15526 [4:25:29<21:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14349/15526 [4:25:29<21:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14350/15526 [4:25:30<21:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14350/15526 [4:25:30<21:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14351/15526 [4:25:31<21:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14351/15526 [4:25:31<21:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14352/15526 [4:25:32<21:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14352/15526 [4:25:32<21:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14353/15526 [4:25:33<21:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14353/15526 [4:25:33<21:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14354/15526 [4:25:33<21:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14354/15526 [4:25:33<21:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14355/15526 [4:25:34<21:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14355/15526 [4:25:34<21:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14356/15526 [4:25:35<21:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14356/15526 [4:25:35<21:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14357/15526 [4:25:35<21:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14357/15526 [4:25:35<21:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14358/15526 [4:25:36<21:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14358/15526 [4:25:36<21:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14359/15526 [4:25:37<21:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14359/15526 [4:25:37<21:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14360/15526 [4:25:37<21:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14360/15526 [4:25:37<21:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 14361/15526 [4:25:38<21:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  92%|▉| 14361/15526 [4:25:38<21:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14362/15526 [4:25:39<21:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14362/15526 [4:25:39<21:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14363/15526 [4:25:40<21:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14363/15526 [4:25:40<21:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14364/15526 [4:25:41<21:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14364/15526 [4:25:41<21:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14365/15526 [4:25:42<21:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14365/15526 [4:25:42<21:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14366/15526 [4:25:42<21:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14366/15526 [4:25:42<21:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14367/15526 [4:25:43<21:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14367/15526 [4:25:43<21:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14368/15526 [4:25:54<21:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14368/15526 [4:25:54<21:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14369/15526 [4:25:55<21:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14369/15526 [4:25:55<21:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14370/15526 [4:25:56<21:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14370/15526 [4:25:56<21:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14371/15526 [4:25:56<21:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14371/15526 [4:25:56<21:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14372/15526 [4:25:57<21:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14372/15526 [4:25:57<21:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14373/15526 [4:25:58<21:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14373/15526 [4:25:58<21:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14374/15526 [4:25:59<21:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14374/15526 [4:25:59<21:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14375/15526 [4:26:00<21:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14375/15526 [4:26:00<21:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14376/15526 [4:26:01<21:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14376/15526 [4:26:01<21:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14377/15526 [4:26:02<21:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14377/15526 [4:26:02<21:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14378/15526 [4:26:03<21:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14378/15526 [4:26:03<21:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14379/15526 [4:26:04<21:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14379/15526 [4:26:04<21:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14380/15526 [4:26:05<21:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14380/15526 [4:26:05<21:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14381/15526 [4:26:05<21:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14381/15526 [4:26:05<21:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14382/15526 [4:26:07<21:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14382/15526 [4:26:07<21:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14383/15526 [4:26:08<21:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14383/15526 [4:26:08<21:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14384/15526 [4:26:09<21:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14384/15526 [4:26:09<21:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14385/15526 [4:26:10<21:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14385/15526 [4:26:10<21:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14386/15526 [4:26:10<21:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14386/15526 [4:26:10<21:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14387/15526 [4:26:11<21:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14387/15526 [4:26:11<21:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14388/15526 [4:26:12<21:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14388/15526 [4:26:12<21:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14389/15526 [4:26:13<21:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14389/15526 [4:26:13<21:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14390/15526 [4:26:14<21:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14390/15526 [4:26:14<21:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14391/15526 [4:26:14<20:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14391/15526 [4:26:14<20:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14392/15526 [4:26:15<20:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14392/15526 [4:26:15<20:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14393/15526 [4:26:16<20:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14393/15526 [4:26:16<20:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14394/15526 [4:26:16<20:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14394/15526 [4:26:16<20:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14395/15526 [4:26:17<20:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14395/15526 [4:26:17<20:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14396/15526 [4:26:18<20:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14396/15526 [4:26:18<20:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14397/15526 [4:26:19<20:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14397/15526 [4:26:19<20:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14398/15526 [4:26:20<20:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14398/15526 [4:26:20<20:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14399/15526 [4:26:21<20:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14399/15526 [4:26:21<20:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14400/15526 [4:26:28<20:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14400/15526 [4:26:28<20:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14401/15526 [4:26:52<20:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14401/15526 [4:26:52<20:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14402/15526 [4:26:54<20:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14402/15526 [4:26:54<20:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14403/15526 [4:26:54<20:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14403/15526 [4:26:54<20:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14404/15526 [4:26:55<20:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14404/15526 [4:26:55<20:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14405/15526 [4:26:56<20:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14405/15526 [4:26:56<20:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14406/15526 [4:26:57<20:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14406/15526 [4:26:57<20:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14407/15526 [4:26:58<20:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14407/15526 [4:26:58<20:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14408/15526 [4:26:58<20:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14408/15526 [4:26:58<20:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14409/15526 [4:26:59<20:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14409/15526 [4:26:59<20:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14410/15526 [4:27:00<20:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14410/15526 [4:27:00<20:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14411/15526 [4:27:01<20:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14411/15526 [4:27:01<20:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14412/15526 [4:27:03<20:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14412/15526 [4:27:03<20:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14413/15526 [4:27:03<20:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14413/15526 [4:27:03<20:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14414/15526 [4:27:04<20:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14414/15526 [4:27:04<20:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14415/15526 [4:27:05<20:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14415/15526 [4:27:05<20:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14416/15526 [4:27:05<20:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14416/15526 [4:27:05<20:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14417/15526 [4:27:06<20:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14417/15526 [4:27:06<20:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14418/15526 [4:27:07<20:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14418/15526 [4:27:07<20:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14419/15526 [4:27:08<20:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14419/15526 [4:27:08<20:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14420/15526 [4:27:09<20:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14420/15526 [4:27:09<20:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14421/15526 [4:27:10<20:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14421/15526 [4:27:10<20:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14422/15526 [4:27:11<20:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14422/15526 [4:27:11<20:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14423/15526 [4:27:13<20:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14423/15526 [4:27:13<20:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14424/15526 [4:27:13<20:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14424/15526 [4:27:13<20:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14425/15526 [4:27:15<20:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14425/15526 [4:27:15<20:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14426/15526 [4:27:15<20:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14426/15526 [4:27:15<20:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14427/15526 [4:27:16<20:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14427/15526 [4:27:16<20:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14428/15526 [4:27:17<20:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14428/15526 [4:27:17<20:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14429/15526 [4:27:17<20:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14429/15526 [4:27:17<20:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14430/15526 [4:27:18<20:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14430/15526 [4:27:18<20:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14431/15526 [4:27:19<20:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14431/15526 [4:27:19<20:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14432/15526 [4:27:26<20:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14432/15526 [4:27:26<20:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14433/15526 [4:27:27<20:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14433/15526 [4:27:27<20:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14434/15526 [4:27:28<20:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14434/15526 [4:27:28<20:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14435/15526 [4:27:29<20:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14435/15526 [4:27:29<20:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14436/15526 [4:27:30<20:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14436/15526 [4:27:30<20:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14437/15526 [4:27:32<20:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14437/15526 [4:27:32<20:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14438/15526 [4:27:32<20:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14438/15526 [4:27:32<20:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14439/15526 [4:27:33<20:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14439/15526 [4:27:33<20:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14440/15526 [4:27:34<20:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14440/15526 [4:27:34<20:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14441/15526 [4:27:35<20:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14441/15526 [4:27:35<20:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14442/15526 [4:27:36<20:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14442/15526 [4:27:36<20:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14443/15526 [4:27:37<20:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14443/15526 [4:27:37<20:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14444/15526 [4:27:37<20:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14444/15526 [4:27:37<20:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14445/15526 [4:27:39<20:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14445/15526 [4:27:39<20:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14446/15526 [4:27:40<20:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14446/15526 [4:27:40<20:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14447/15526 [4:27:40<19:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14447/15526 [4:27:40<19:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14448/15526 [4:27:41<19:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14448/15526 [4:27:41<19:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14449/15526 [4:27:42<19:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14449/15526 [4:27:42<19:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14450/15526 [4:27:42<19:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14450/15526 [4:27:42<19:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14451/15526 [4:27:44<19:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14451/15526 [4:27:44<19:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14452/15526 [4:27:45<19:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14452/15526 [4:27:45<19:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14453/15526 [4:27:45<19:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14453/15526 [4:27:45<19:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14454/15526 [4:27:47<19:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14454/15526 [4:27:47<19:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14455/15526 [4:27:47<19:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14455/15526 [4:27:47<19:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14456/15526 [4:27:49<19:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14456/15526 [4:27:49<19:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14457/15526 [4:27:49<19:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14457/15526 [4:27:49<19:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14458/15526 [4:27:50<19:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14458/15526 [4:27:50<19:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14459/15526 [4:27:51<19:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14459/15526 [4:27:51<19:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14460/15526 [4:27:52<19:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14460/15526 [4:27:52<19:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14461/15526 [4:27:53<19:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14461/15526 [4:27:53<19:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14462/15526 [4:27:53<19:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14462/15526 [4:27:53<19:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14463/15526 [4:27:54<19:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14463/15526 [4:27:54<19:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14464/15526 [4:28:01<19:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14464/15526 [4:28:01<19:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14465/15526 [4:28:02<19:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14465/15526 [4:28:02<19:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14466/15526 [4:28:03<19:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14466/15526 [4:28:03<19:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14467/15526 [4:28:03<19:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14467/15526 [4:28:03<19:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14468/15526 [4:28:05<19:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14468/15526 [4:28:05<19:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14469/15526 [4:28:05<19:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14469/15526 [4:28:05<19:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14470/15526 [4:28:07<19:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14470/15526 [4:28:07<19:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14471/15526 [4:28:07<19:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14471/15526 [4:28:07<19:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14472/15526 [4:28:08<19:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14472/15526 [4:28:08<19:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14473/15526 [4:28:09<19:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14473/15526 [4:28:09<19:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14474/15526 [4:28:09<19:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14474/15526 [4:28:09<19:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14475/15526 [4:28:11<19:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14475/15526 [4:28:11<19:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14476/15526 [4:28:12<19:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14476/15526 [4:28:12<19:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14477/15526 [4:28:13<19:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14477/15526 [4:28:13<19:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14478/15526 [4:28:14<19:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14478/15526 [4:28:14<19:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14479/15526 [4:28:14<19:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14479/15526 [4:28:14<19:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14480/15526 [4:28:15<19:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14480/15526 [4:28:15<19:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14481/15526 [4:28:17<19:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14481/15526 [4:28:17<19:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14482/15526 [4:28:17<19:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14482/15526 [4:28:17<19:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14483/15526 [4:28:19<19:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14483/15526 [4:28:19<19:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14484/15526 [4:28:19<19:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14484/15526 [4:28:19<19:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14485/15526 [4:28:20<19:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14485/15526 [4:28:20<19:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14486/15526 [4:28:21<19:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14486/15526 [4:28:21<19:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14487/15526 [4:28:22<19:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14487/15526 [4:28:22<19:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14488/15526 [4:28:22<19:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14488/15526 [4:28:22<19:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14489/15526 [4:28:23<19:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14489/15526 [4:28:23<19:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14490/15526 [4:28:24<19:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14490/15526 [4:28:24<19:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14491/15526 [4:28:25<19:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14491/15526 [4:28:25<19:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14492/15526 [4:28:25<19:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14492/15526 [4:28:25<19:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14493/15526 [4:28:26<19:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14493/15526 [4:28:26<19:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14494/15526 [4:28:27<19:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14494/15526 [4:28:27<19:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14495/15526 [4:28:27<19:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14495/15526 [4:28:27<19:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14496/15526 [4:28:36<19:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14496/15526 [4:28:36<19:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14497/15526 [4:28:37<19:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14497/15526 [4:28:37<19:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14498/15526 [4:28:38<19:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14498/15526 [4:28:38<19:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14499/15526 [4:28:39<19:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14499/15526 [4:28:39<19:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14500/15526 [4:28:40<19:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14500/15526 [4:28:40<19:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14501/15526 [4:28:40<18:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14501/15526 [4:28:40<18:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14502/15526 [4:28:41<18:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14502/15526 [4:28:41<18:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14503/15526 [4:28:42<18:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14503/15526 [4:28:42<18:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14504/15526 [4:28:44<18:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14504/15526 [4:28:44<18:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14505/15526 [4:28:45<18:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14505/15526 [4:28:45<18:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14506/15526 [4:28:45<18:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14506/15526 [4:28:45<18:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14507/15526 [4:28:47<18:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14507/15526 [4:28:47<18:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14508/15526 [4:28:47<18:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14508/15526 [4:28:47<18:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14509/15526 [4:28:48<18:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14509/15526 [4:28:48<18:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14510/15526 [4:28:49<18:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14510/15526 [4:28:49<18:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14511/15526 [4:28:49<18:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14511/15526 [4:28:49<18:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14512/15526 [4:28:50<18:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14512/15526 [4:28:50<18:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14513/15526 [4:28:51<18:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14513/15526 [4:28:51<18:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14514/15526 [4:28:52<18:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14514/15526 [4:28:52<18:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14515/15526 [4:28:53<18:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14515/15526 [4:28:53<18:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 14516/15526 [4:28:54<18:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  93%|▉| 14516/15526 [4:28:54<18:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14517/15526 [4:28:55<18:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14517/15526 [4:28:55<18:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14518/15526 [4:28:55<18:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14518/15526 [4:28:55<18:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14519/15526 [4:28:56<18:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14519/15526 [4:28:56<18:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14520/15526 [4:28:57<18:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14520/15526 [4:28:57<18:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14521/15526 [4:28:57<18:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14521/15526 [4:28:57<18:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14522/15526 [4:28:58<18:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14522/15526 [4:28:58<18:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14523/15526 [4:28:59<18:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14523/15526 [4:28:59<18:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14524/15526 [4:28:59<18:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14524/15526 [4:28:59<18:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14525/15526 [4:29:01<18:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14525/15526 [4:29:01<18:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14526/15526 [4:29:02<18:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14526/15526 [4:29:02<18:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14527/15526 [4:29:03<18:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14527/15526 [4:29:03<18:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14528/15526 [4:29:11<18:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14528/15526 [4:29:11<18:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14529/15526 [4:29:12<18:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14529/15526 [4:29:12<18:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14530/15526 [4:29:13<18:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14530/15526 [4:29:13<18:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14531/15526 [4:29:13<18:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14531/15526 [4:29:13<18:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14532/15526 [4:29:14<18:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14532/15526 [4:29:14<18:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14533/15526 [4:29:15<18:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14533/15526 [4:29:15<18:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14534/15526 [4:29:16<18:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14534/15526 [4:29:16<18:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14535/15526 [4:29:16<18:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14535/15526 [4:29:16<18:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14536/15526 [4:29:17<18:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14536/15526 [4:29:17<18:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14537/15526 [4:29:18<18:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14537/15526 [4:29:18<18:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14538/15526 [4:29:18<18:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14538/15526 [4:29:18<18:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14539/15526 [4:29:19<18:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14539/15526 [4:29:19<18:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14540/15526 [4:29:20<18:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14540/15526 [4:29:20<18:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14541/15526 [4:29:21<18:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14541/15526 [4:29:21<18:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14542/15526 [4:29:22<18:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14542/15526 [4:29:22<18:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14543/15526 [4:29:23<18:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14543/15526 [4:29:23<18:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14544/15526 [4:29:23<18:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14544/15526 [4:29:23<18:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14545/15526 [4:29:25<18:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14545/15526 [4:29:25<18:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14546/15526 [4:29:26<18:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14546/15526 [4:29:26<18:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14547/15526 [4:29:27<18:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14547/15526 [4:29:27<18:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14548/15526 [4:29:27<18:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14548/15526 [4:29:27<18:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14549/15526 [4:29:28<18:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14549/15526 [4:29:28<18:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14550/15526 [4:29:29<18:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14550/15526 [4:29:29<18:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14551/15526 [4:29:30<18:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14551/15526 [4:29:30<18:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14552/15526 [4:29:31<18:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14552/15526 [4:29:31<18:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14553/15526 [4:29:32<18:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14553/15526 [4:29:32<18:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14554/15526 [4:29:32<18:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14554/15526 [4:29:32<18:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14555/15526 [4:29:33<17:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14555/15526 [4:29:33<17:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14556/15526 [4:29:34<17:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14556/15526 [4:29:34<17:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14557/15526 [4:29:35<17:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14557/15526 [4:29:35<17:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14558/15526 [4:29:36<17:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14558/15526 [4:29:36<17:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14559/15526 [4:29:37<17:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14559/15526 [4:29:37<17:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14560/15526 [4:29:45<17:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14560/15526 [4:29:45<17:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14561/15526 [4:29:46<17:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14561/15526 [4:29:46<17:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14562/15526 [4:29:47<17:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14562/15526 [4:29:47<17:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14563/15526 [4:29:48<17:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14563/15526 [4:29:48<17:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14564/15526 [4:29:49<17:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14564/15526 [4:29:49<17:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14565/15526 [4:29:50<17:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14565/15526 [4:29:50<17:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14566/15526 [4:29:52<17:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14566/15526 [4:29:52<17:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14567/15526 [4:29:52<17:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14567/15526 [4:29:52<17:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14568/15526 [4:29:54<17:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14568/15526 [4:29:54<17:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14569/15526 [4:29:54<17:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14569/15526 [4:29:54<17:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14570/15526 [4:29:55<17:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14570/15526 [4:29:55<17:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14571/15526 [4:29:56<17:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14571/15526 [4:29:56<17:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14572/15526 [4:29:57<17:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14572/15526 [4:29:57<17:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14573/15526 [4:29:57<17:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14573/15526 [4:29:57<17:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14574/15526 [4:29:59<17:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14574/15526 [4:29:59<17:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14575/15526 [4:29:59<17:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14575/15526 [4:29:59<17:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14576/15526 [4:30:00<17:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14576/15526 [4:30:00<17:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14577/15526 [4:30:01<17:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14577/15526 [4:30:01<17:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14578/15526 [4:30:02<17:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14578/15526 [4:30:02<17:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14579/15526 [4:30:03<17:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14579/15526 [4:30:03<17:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14580/15526 [4:30:04<17:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14580/15526 [4:30:04<17:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14581/15526 [4:30:05<17:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14581/15526 [4:30:05<17:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14582/15526 [4:30:06<17:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14582/15526 [4:30:06<17:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14583/15526 [4:30:06<17:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14583/15526 [4:30:06<17:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14584/15526 [4:30:08<17:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14584/15526 [4:30:08<17:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14585/15526 [4:30:09<17:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14585/15526 [4:30:09<17:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14586/15526 [4:30:10<17:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14586/15526 [4:30:10<17:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14587/15526 [4:30:11<17:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14587/15526 [4:30:11<17:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14588/15526 [4:30:12<17:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14588/15526 [4:30:12<17:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14589/15526 [4:30:13<17:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14589/15526 [4:30:13<17:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14590/15526 [4:30:14<17:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14590/15526 [4:30:14<17:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14591/15526 [4:30:15<17:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14591/15526 [4:30:15<17:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14592/15526 [4:30:21<17:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14592/15526 [4:30:21<17:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14593/15526 [4:30:22<17:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14593/15526 [4:30:22<17:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14594/15526 [4:30:23<17:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14594/15526 [4:30:23<17:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14595/15526 [4:30:24<17:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14595/15526 [4:30:24<17:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14596/15526 [4:30:24<17:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14596/15526 [4:30:24<17:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14597/15526 [4:30:25<17:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14597/15526 [4:30:25<17:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14598/15526 [4:30:26<17:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14598/15526 [4:30:26<17:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14599/15526 [4:30:27<17:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14599/15526 [4:30:27<17:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14600/15526 [4:30:28<17:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14600/15526 [4:30:28<17:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14601/15526 [4:30:29<17:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14601/15526 [4:30:29<17:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14602/15526 [4:30:29<17:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14602/15526 [4:30:29<17:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14603/15526 [4:30:30<17:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14603/15526 [4:30:30<17:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14604/15526 [4:30:31<17:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14604/15526 [4:30:31<17:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14605/15526 [4:30:31<17:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14605/15526 [4:30:31<17:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14606/15526 [4:30:32<17:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14606/15526 [4:30:32<17:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14607/15526 [4:30:33<17:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14607/15526 [4:30:33<17:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14608/15526 [4:30:34<17:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14608/15526 [4:30:34<17:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14609/15526 [4:30:35<16:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14609/15526 [4:30:35<16:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14610/15526 [4:30:36<16:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14610/15526 [4:30:36<16:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14611/15526 [4:30:37<16:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14611/15526 [4:30:37<16:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14612/15526 [4:30:37<16:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14612/15526 [4:30:37<16:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14613/15526 [4:30:38<16:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14613/15526 [4:30:38<16:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14614/15526 [4:30:39<16:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14614/15526 [4:30:39<16:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14615/15526 [4:30:40<16:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14615/15526 [4:30:40<16:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14616/15526 [4:30:40<16:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14616/15526 [4:30:40<16:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14617/15526 [4:30:41<16:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14617/15526 [4:30:41<16:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14618/15526 [4:30:42<16:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14618/15526 [4:30:42<16:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14619/15526 [4:30:43<16:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14619/15526 [4:30:43<16:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14620/15526 [4:30:44<16:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14620/15526 [4:30:44<16:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14621/15526 [4:30:45<16:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14621/15526 [4:30:45<16:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14622/15526 [4:30:46<16:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14622/15526 [4:30:46<16:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14623/15526 [4:30:47<16:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14623/15526 [4:30:47<16:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14624/15526 [4:30:55<16:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14624/15526 [4:30:55<16:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14625/15526 [4:30:56<16:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14625/15526 [4:30:56<16:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14626/15526 [4:30:57<16:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14626/15526 [4:30:57<16:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14627/15526 [4:30:58<16:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14627/15526 [4:30:58<16:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14628/15526 [4:30:59<16:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14628/15526 [4:30:59<16:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14629/15526 [4:31:00<16:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14629/15526 [4:31:00<16:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14630/15526 [4:31:00<16:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14630/15526 [4:31:00<16:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14631/15526 [4:31:02<16:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14631/15526 [4:31:02<16:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14632/15526 [4:31:02<16:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14632/15526 [4:31:02<16:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14633/15526 [4:31:03<16:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14633/15526 [4:31:03<16:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14634/15526 [4:31:04<16:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14634/15526 [4:31:04<16:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14635/15526 [4:31:05<16:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14635/15526 [4:31:05<16:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14636/15526 [4:31:06<16:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14636/15526 [4:31:06<16:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14637/15526 [4:31:07<16:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14637/15526 [4:31:07<16:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14638/15526 [4:31:07<16:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14638/15526 [4:31:07<16:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14639/15526 [4:31:09<16:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14639/15526 [4:31:09<16:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14640/15526 [4:31:09<16:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14640/15526 [4:31:09<16:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14641/15526 [4:31:10<16:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14641/15526 [4:31:10<16:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14642/15526 [4:31:11<16:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14642/15526 [4:31:11<16:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14643/15526 [4:31:11<16:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14643/15526 [4:31:11<16:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14644/15526 [4:31:13<16:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14644/15526 [4:31:13<16:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14645/15526 [4:31:14<16:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14645/15526 [4:31:14<16:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14646/15526 [4:31:14<16:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14646/15526 [4:31:14<16:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14647/15526 [4:31:15<16:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14647/15526 [4:31:15<16:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14648/15526 [4:31:16<16:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14648/15526 [4:31:16<16:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14649/15526 [4:31:17<16:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14649/15526 [4:31:17<16:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14650/15526 [4:31:18<16:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14650/15526 [4:31:18<16:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14651/15526 [4:31:18<16:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14651/15526 [4:31:18<16:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14652/15526 [4:31:19<16:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14652/15526 [4:31:19<16:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14653/15526 [4:31:21<16:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14653/15526 [4:31:21<16:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14654/15526 [4:31:22<16:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14654/15526 [4:31:22<16:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14655/15526 [4:31:23<16:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14655/15526 [4:31:23<16:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14656/15526 [4:31:29<16:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14656/15526 [4:31:29<16:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14657/15526 [4:31:30<16:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14657/15526 [4:31:30<16:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14658/15526 [4:31:31<16:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14658/15526 [4:31:31<16:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14659/15526 [4:31:32<16:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14659/15526 [4:31:32<16:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14660/15526 [4:31:33<16:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14660/15526 [4:31:33<16:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14661/15526 [4:31:33<16:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14661/15526 [4:31:33<16:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14662/15526 [4:31:34<16:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14662/15526 [4:31:34<16:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14663/15526 [4:31:35<15:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14663/15526 [4:31:35<15:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14664/15526 [4:31:36<15:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14664/15526 [4:31:36<15:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14665/15526 [4:31:37<15:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14665/15526 [4:31:37<15:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14666/15526 [4:31:37<15:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14666/15526 [4:31:37<15:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14667/15526 [4:31:38<15:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14667/15526 [4:31:38<15:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14668/15526 [4:31:39<15:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14668/15526 [4:31:39<15:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14669/15526 [4:31:40<15:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14669/15526 [4:31:40<15:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14670/15526 [4:31:41<15:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14670/15526 [4:31:41<15:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14671/15526 [4:31:42<15:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14671/15526 [4:31:42<15:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 14672/15526 [4:31:42<15:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  94%|▉| 14672/15526 [4:31:42<15:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14673/15526 [4:31:44<15:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14673/15526 [4:31:44<15:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14674/15526 [4:31:45<15:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14674/15526 [4:31:45<15:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14675/15526 [4:31:45<15:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14675/15526 [4:31:45<15:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14676/15526 [4:31:47<15:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14676/15526 [4:31:47<15:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14677/15526 [4:31:48<15:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14677/15526 [4:31:48<15:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14678/15526 [4:31:49<15:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14678/15526 [4:31:49<15:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14679/15526 [4:31:50<15:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14679/15526 [4:31:50<15:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14680/15526 [4:31:51<15:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14680/15526 [4:31:51<15:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14681/15526 [4:31:52<15:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14681/15526 [4:31:52<15:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14682/15526 [4:31:53<15:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14682/15526 [4:31:53<15:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14683/15526 [4:31:53<15:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14683/15526 [4:31:53<15:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14684/15526 [4:31:54<15:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14684/15526 [4:31:54<15:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14685/15526 [4:31:55<15:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14685/15526 [4:31:55<15:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14686/15526 [4:31:56<15:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14686/15526 [4:31:56<15:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14687/15526 [4:31:57<15:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14687/15526 [4:31:57<15:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14688/15526 [4:32:03<15:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14688/15526 [4:32:03<15:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14689/15526 [4:32:04<15:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14689/15526 [4:32:04<15:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14690/15526 [4:32:04<15:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14690/15526 [4:32:04<15:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14691/15526 [4:32:05<15:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14691/15526 [4:32:05<15:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14692/15526 [4:32:06<15:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14692/15526 [4:32:06<15:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14693/15526 [4:32:07<15:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14693/15526 [4:32:07<15:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14694/15526 [4:32:08<15:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14694/15526 [4:32:08<15:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14695/15526 [4:32:09<15:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14695/15526 [4:32:09<15:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14696/15526 [4:32:09<15:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14696/15526 [4:32:09<15:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14697/15526 [4:32:10<15:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14697/15526 [4:32:10<15:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14698/15526 [4:32:11<15:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14698/15526 [4:32:11<15:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14699/15526 [4:32:12<15:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14699/15526 [4:32:12<15:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14700/15526 [4:32:13<15:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14700/15526 [4:32:13<15:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14701/15526 [4:32:14<15:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14701/15526 [4:32:14<15:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14702/15526 [4:32:15<15:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14702/15526 [4:32:15<15:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14703/15526 [4:32:16<15:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14703/15526 [4:32:16<15:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14704/15526 [4:32:16<15:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14704/15526 [4:32:16<15:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14705/15526 [4:32:17<15:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14705/15526 [4:32:17<15:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14706/15526 [4:32:18<15:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14706/15526 [4:32:18<15:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14707/15526 [4:32:19<15:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14707/15526 [4:32:19<15:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14708/15526 [4:32:20<15:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14708/15526 [4:32:20<15:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14709/15526 [4:32:20<15:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14709/15526 [4:32:20<15:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14710/15526 [4:32:21<15:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14710/15526 [4:32:21<15:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14711/15526 [4:32:22<15:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14711/15526 [4:32:22<15:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14712/15526 [4:32:23<15:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14712/15526 [4:32:23<15:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14713/15526 [4:32:23<15:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14713/15526 [4:32:23<15:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14714/15526 [4:32:24<15:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14714/15526 [4:32:24<15:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14715/15526 [4:32:25<15:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14715/15526 [4:32:25<15:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14716/15526 [4:32:26<14:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14716/15526 [4:32:26<14:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14717/15526 [4:32:28<14:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14717/15526 [4:32:28<14:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14718/15526 [4:32:28<14:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14718/15526 [4:32:28<14:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14719/15526 [4:32:29<14:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14719/15526 [4:32:29<14:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14720/15526 [4:32:38<14:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14720/15526 [4:32:38<14:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14721/15526 [4:32:38<14:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14721/15526 [4:32:38<14:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14722/15526 [4:32:39<14:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14722/15526 [4:32:39<14:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14723/15526 [4:32:40<14:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14723/15526 [4:32:40<14:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14724/15526 [4:32:40<14:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14724/15526 [4:32:40<14:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14725/15526 [4:32:42<14:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14725/15526 [4:32:42<14:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14726/15526 [4:32:42<14:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14726/15526 [4:32:42<14:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14727/15526 [4:32:43<14:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14727/15526 [4:32:43<14:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14728/15526 [4:32:44<14:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14728/15526 [4:32:44<14:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14729/15526 [4:32:44<14:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14729/15526 [4:32:44<14:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14730/15526 [4:32:45<14:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14730/15526 [4:32:45<14:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14731/15526 [4:32:46<14:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14731/15526 [4:32:46<14:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14732/15526 [4:32:47<14:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14732/15526 [4:32:47<14:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14733/15526 [4:32:48<14:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14733/15526 [4:32:48<14:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14734/15526 [4:32:49<14:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14734/15526 [4:32:49<14:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14735/15526 [4:32:50<14:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14735/15526 [4:32:50<14:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14736/15526 [4:32:51<14:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14736/15526 [4:32:51<14:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14737/15526 [4:32:52<14:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14737/15526 [4:32:52<14:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14738/15526 [4:32:53<14:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14738/15526 [4:32:53<14:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14739/15526 [4:32:54<14:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14739/15526 [4:32:54<14:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14740/15526 [4:32:55<14:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14740/15526 [4:32:55<14:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14741/15526 [4:32:55<14:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14741/15526 [4:32:55<14:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14742/15526 [4:32:56<14:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14742/15526 [4:32:56<14:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14743/15526 [4:32:57<14:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14743/15526 [4:32:57<14:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14744/15526 [4:32:58<14:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14744/15526 [4:32:58<14:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14745/15526 [4:32:59<14:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14745/15526 [4:32:59<14:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14746/15526 [4:32:59<14:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14746/15526 [4:32:59<14:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14747/15526 [4:33:00<14:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14747/15526 [4:33:00<14:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14748/15526 [4:33:01<14:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14748/15526 [4:33:01<14:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14749/15526 [4:33:02<14:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14749/15526 [4:33:02<14:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14750/15526 [4:33:03<14:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14750/15526 [4:33:03<14:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14751/15526 [4:33:04<14:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14751/15526 [4:33:04<14:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14752/15526 [4:33:14<14:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14752/15526 [4:33:14<14:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14753/15526 [4:33:15<14:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14753/15526 [4:33:15<14:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14754/15526 [4:33:15<14:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14754/15526 [4:33:15<14:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14755/15526 [4:33:16<14:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14755/15526 [4:33:16<14:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14756/15526 [4:33:17<14:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14756/15526 [4:33:17<14:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14757/15526 [4:33:17<14:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14757/15526 [4:33:17<14:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14758/15526 [4:33:19<14:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14758/15526 [4:33:19<14:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14759/15526 [4:33:20<14:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14759/15526 [4:33:20<14:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14760/15526 [4:33:21<14:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14760/15526 [4:33:21<14:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14761/15526 [4:33:22<14:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14761/15526 [4:33:22<14:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14762/15526 [4:33:23<14:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14762/15526 [4:33:23<14:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14763/15526 [4:33:23<14:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14763/15526 [4:33:23<14:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14764/15526 [4:33:24<14:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14764/15526 [4:33:24<14:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14765/15526 [4:33:25<14:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14765/15526 [4:33:25<14:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14766/15526 [4:33:25<14:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14766/15526 [4:33:25<14:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14767/15526 [4:33:26<14:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14767/15526 [4:33:26<14:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14768/15526 [4:33:27<14:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14768/15526 [4:33:27<14:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14769/15526 [4:33:28<14:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14769/15526 [4:33:28<14:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14770/15526 [4:33:29<13:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14770/15526 [4:33:29<13:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14771/15526 [4:33:29<13:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14771/15526 [4:33:29<13:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14772/15526 [4:33:30<13:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14772/15526 [4:33:30<13:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14773/15526 [4:33:31<13:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14773/15526 [4:33:31<13:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14774/15526 [4:33:32<13:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14774/15526 [4:33:32<13:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14775/15526 [4:33:33<13:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14775/15526 [4:33:33<13:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14776/15526 [4:33:34<13:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14776/15526 [4:33:34<13:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14777/15526 [4:33:35<13:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14777/15526 [4:33:35<13:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14778/15526 [4:33:35<13:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14778/15526 [4:33:35<13:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|��| 14779/15526 [4:33:36<13:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14779/15526 [4:33:36<13:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14780/15526 [4:33:37<13:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14780/15526 [4:33:37<13:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14781/15526 [4:33:38<13:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14781/15526 [4:33:38<13:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14782/15526 [4:33:39<13:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14782/15526 [4:33:39<13:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14783/15526 [4:33:40<13:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14783/15526 [4:33:40<13:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14784/15526 [4:33:49<13:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14784/15526 [4:33:49<13:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14785/15526 [4:33:50<13:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14785/15526 [4:33:50<13:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14786/15526 [4:33:51<13:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14786/15526 [4:33:51<13:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14787/15526 [4:33:52<13:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14787/15526 [4:33:52<13:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14788/15526 [4:33:53<13:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14788/15526 [4:33:53<13:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14789/15526 [4:33:53<13:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14789/15526 [4:33:53<13:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14790/15526 [4:33:54<13:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14790/15526 [4:33:54<13:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14791/15526 [4:33:55<13:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14791/15526 [4:33:55<13:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14792/15526 [4:33:56<13:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14792/15526 [4:33:56<13:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14793/15526 [4:33:57<13:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14793/15526 [4:33:57<13:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14794/15526 [4:33:57<13:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14794/15526 [4:33:57<13:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14795/15526 [4:33:58<13:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14795/15526 [4:33:58<13:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14796/15526 [4:34:00<13:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14796/15526 [4:34:00<13:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14797/15526 [4:34:01<13:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14797/15526 [4:34:01<13:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14798/15526 [4:34:02<13:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14798/15526 [4:34:02<13:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14799/15526 [4:34:03<13:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14799/15526 [4:34:03<13:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14800/15526 [4:34:04<13:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14800/15526 [4:34:04<13:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14801/15526 [4:34:05<13:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14801/15526 [4:34:05<13:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14802/15526 [4:34:05<13:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14802/15526 [4:34:05<13:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14803/15526 [4:34:07<13:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14803/15526 [4:34:07<13:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14804/15526 [4:34:07<13:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14804/15526 [4:34:07<13:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14805/15526 [4:34:08<13:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14805/15526 [4:34:08<13:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14806/15526 [4:34:09<13:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14806/15526 [4:34:09<13:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14807/15526 [4:34:09<13:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14807/15526 [4:34:09<13:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14808/15526 [4:34:11<13:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14808/15526 [4:34:11<13:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14809/15526 [4:34:11<13:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14809/15526 [4:34:11<13:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14810/15526 [4:34:12<13:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14810/15526 [4:34:12<13:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14811/15526 [4:34:13<13:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14811/15526 [4:34:13<13:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14812/15526 [4:34:14<13:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14812/15526 [4:34:14<13:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14813/15526 [4:34:15<13:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14813/15526 [4:34:15<13:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14814/15526 [4:34:16<13:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14814/15526 [4:34:16<13:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14815/15526 [4:34:16<13:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14815/15526 [4:34:16<13:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14816/15526 [4:34:24<13:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14816/15526 [4:34:24<13:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14817/15526 [4:34:25<13:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14817/15526 [4:34:25<13:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14818/15526 [4:34:25<13:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14818/15526 [4:34:25<13:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14819/15526 [4:34:26<13:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14819/15526 [4:34:26<13:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14820/15526 [4:34:27<13:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14820/15526 [4:34:27<13:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14821/15526 [4:34:28<13:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14821/15526 [4:34:28<13:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14822/15526 [4:34:29<13:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14822/15526 [4:34:29<13:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14823/15526 [4:34:30<13:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14823/15526 [4:34:30<13:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14824/15526 [4:34:31<13:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14824/15526 [4:34:31<13:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14825/15526 [4:34:32<12:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14825/15526 [4:34:32<12:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14826/15526 [4:34:33<12:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14826/15526 [4:34:33<12:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 14827/15526 [4:34:34<12:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  95%|▉| 14827/15526 [4:34:34<12:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14828/15526 [4:34:34<12:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14828/15526 [4:34:34<12:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14829/15526 [4:34:35<12:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14829/15526 [4:34:35<12:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14830/15526 [4:34:36<12:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14830/15526 [4:34:36<12:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14831/15526 [4:34:37<12:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14831/15526 [4:34:37<12:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14832/15526 [4:34:38<12:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14832/15526 [4:34:38<12:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14833/15526 [4:34:39<12:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14833/15526 [4:34:39<12:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14834/15526 [4:34:39<12:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14834/15526 [4:34:39<12:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14835/15526 [4:34:40<12:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14835/15526 [4:34:40<12:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14836/15526 [4:34:41<12:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14836/15526 [4:34:41<12:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14837/15526 [4:34:41<12:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14837/15526 [4:34:41<12:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14838/15526 [4:34:42<12:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14838/15526 [4:34:42<12:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14839/15526 [4:34:43<12:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14839/15526 [4:34:43<12:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14840/15526 [4:34:44<12:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14840/15526 [4:34:44<12:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14841/15526 [4:34:45<12:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14841/15526 [4:34:45<12:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14842/15526 [4:34:45<12:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14842/15526 [4:34:45<12:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14843/15526 [4:34:47<12:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14843/15526 [4:34:47<12:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14844/15526 [4:34:47<12:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14844/15526 [4:34:47<12:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14845/15526 [4:34:48<12:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14845/15526 [4:34:48<12:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14846/15526 [4:34:49<12:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14846/15526 [4:34:49<12:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14847/15526 [4:34:49<12:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14847/15526 [4:34:49<12:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14848/15526 [4:34:59<12:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14848/15526 [4:34:59<12:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14849/15526 [4:35:00<12:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14849/15526 [4:35:00<12:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14850/15526 [4:35:01<12:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14850/15526 [4:35:01<12:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14851/15526 [4:35:02<12:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14851/15526 [4:35:02<12:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14852/15526 [4:35:03<12:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14852/15526 [4:35:03<12:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14853/15526 [4:35:04<12:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14853/15526 [4:35:04<12:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14854/15526 [4:35:05<12:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14854/15526 [4:35:05<12:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14855/15526 [4:35:06<12:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14855/15526 [4:35:06<12:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14856/15526 [4:35:06<12:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14856/15526 [4:35:06<12:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14857/15526 [4:35:08<12:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14857/15526 [4:35:08<12:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14858/15526 [4:35:09<12:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14858/15526 [4:35:09<12:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14859/15526 [4:35:09<12:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14859/15526 [4:35:09<12:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14860/15526 [4:35:11<12:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14860/15526 [4:35:11<12:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14861/15526 [4:35:12<12:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14861/15526 [4:35:12<12:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14862/15526 [4:35:12<12:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14862/15526 [4:35:12<12:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14863/15526 [4:35:13<12:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14863/15526 [4:35:13<12:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14864/15526 [4:35:14<12:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14864/15526 [4:35:14<12:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14865/15526 [4:35:14<12:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14865/15526 [4:35:14<12:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14866/15526 [4:35:15<12:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14866/15526 [4:35:15<12:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14867/15526 [4:35:16<12:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14867/15526 [4:35:16<12:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14868/15526 [4:35:17<12:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14868/15526 [4:35:17<12:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14869/15526 [4:35:18<12:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14869/15526 [4:35:18<12:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14870/15526 [4:35:18<12:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14870/15526 [4:35:18<12:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14871/15526 [4:35:19<12:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14871/15526 [4:35:19<12:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14872/15526 [4:35:20<12:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14872/15526 [4:35:20<12:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14873/15526 [4:35:21<12:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14873/15526 [4:35:21<12:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14874/15526 [4:35:22<12:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14874/15526 [4:35:22<12:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14875/15526 [4:35:22<12:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14875/15526 [4:35:22<12:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14876/15526 [4:35:23<12:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14876/15526 [4:35:23<12:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14877/15526 [4:35:24<12:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14877/15526 [4:35:24<12:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14878/15526 [4:35:24<11:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14878/15526 [4:35:24<11:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14879/15526 [4:35:25<11:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14879/15526 [4:35:25<11:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14880/15526 [4:35:35<11:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14880/15526 [4:35:35<11:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14881/15526 [4:35:35<11:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14881/15526 [4:35:35<11:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14882/15526 [4:35:36<11:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14882/15526 [4:35:36<11:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14883/15526 [4:35:38<11:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14883/15526 [4:35:38<11:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14884/15526 [4:35:38<11:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14884/15526 [4:35:38<11:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14885/15526 [4:35:39<11:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14885/15526 [4:35:39<11:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14886/15526 [4:35:40<11:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14886/15526 [4:35:40<11:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14887/15526 [4:35:41<11:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14887/15526 [4:35:41<11:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14888/15526 [4:35:42<11:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14888/15526 [4:35:42<11:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14889/15526 [4:35:44<11:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14889/15526 [4:35:44<11:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14890/15526 [4:35:45<11:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14890/15526 [4:35:45<11:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14891/15526 [4:35:45<11:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14891/15526 [4:35:45<11:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14892/15526 [4:35:46<11:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14892/15526 [4:35:46<11:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14893/15526 [4:35:47<11:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14893/15526 [4:35:47<11:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14894/15526 [4:35:48<11:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14894/15526 [4:35:48<11:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14895/15526 [4:35:49<11:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14895/15526 [4:35:49<11:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14896/15526 [4:35:50<11:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14896/15526 [4:35:50<11:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14897/15526 [4:35:50<11:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14897/15526 [4:35:50<11:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14898/15526 [4:35:51<11:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14898/15526 [4:35:51<11:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14899/15526 [4:35:52<11:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14899/15526 [4:35:52<11:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14900/15526 [4:35:53<11:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14900/15526 [4:35:53<11:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14901/15526 [4:35:54<11:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14901/15526 [4:35:54<11:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14902/15526 [4:35:54<11:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14902/15526 [4:35:54<11:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14903/15526 [4:35:55<11:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14903/15526 [4:35:55<11:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14904/15526 [4:35:56<11:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14904/15526 [4:35:56<11:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14905/15526 [4:35:56<11:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14905/15526 [4:35:56<11:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14906/15526 [4:35:57<11:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14906/15526 [4:35:57<11:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14907/15526 [4:35:58<11:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14907/15526 [4:35:58<11:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14908/15526 [4:35:59<11:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14908/15526 [4:35:59<11:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14909/15526 [4:36:00<11:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14909/15526 [4:36:00<11:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14910/15526 [4:36:01<11:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14910/15526 [4:36:01<11:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14911/15526 [4:36:01<11:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14911/15526 [4:36:01<11:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14912/15526 [4:36:08<11:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14912/15526 [4:36:08<11:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14913/15526 [4:36:09<11:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14913/15526 [4:36:09<11:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14914/15526 [4:36:11<11:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14914/15526 [4:36:11<11:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14915/15526 [4:36:12<11:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14915/15526 [4:36:12<11:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14916/15526 [4:36:13<11:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14916/15526 [4:36:13<11:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14917/15526 [4:36:13<11:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14917/15526 [4:36:13<11:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14918/15526 [4:36:14<11:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14918/15526 [4:36:14<11:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14919/15526 [4:36:15<11:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14919/15526 [4:36:15<11:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14920/15526 [4:36:16<11:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14920/15526 [4:36:16<11:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14921/15526 [4:36:17<11:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14921/15526 [4:36:17<11:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14922/15526 [4:36:18<11:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14922/15526 [4:36:18<11:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14923/15526 [4:36:19<11:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14923/15526 [4:36:19<11:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14924/15526 [4:36:19<11:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14924/15526 [4:36:19<11:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14925/15526 [4:36:20<11:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14925/15526 [4:36:20<11:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14926/15526 [4:36:21<11:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14926/15526 [4:36:21<11:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14927/15526 [4:36:22<11:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14927/15526 [4:36:22<11:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14928/15526 [4:36:23<11:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14928/15526 [4:36:23<11:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14929/15526 [4:36:24<11:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14929/15526 [4:36:24<11:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14930/15526 [4:36:26<11:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14930/15526 [4:36:26<11:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14931/15526 [4:36:27<11:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14931/15526 [4:36:27<11:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14932/15526 [4:36:27<10:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14932/15526 [4:36:27<10:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14933/15526 [4:36:28<10:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14933/15526 [4:36:28<10:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14934/15526 [4:36:29<10:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14934/15526 [4:36:29<10:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14935/15526 [4:36:29<10:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14935/15526 [4:36:29<10:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14936/15526 [4:36:30<10:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14936/15526 [4:36:30<10:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14937/15526 [4:36:31<10:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14937/15526 [4:36:31<10:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14938/15526 [4:36:32<10:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14938/15526 [4:36:32<10:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14939/15526 [4:36:33<10:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14939/15526 [4:36:33<10:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14940/15526 [4:36:34<10:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14940/15526 [4:36:34<10:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14941/15526 [4:36:35<10:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14941/15526 [4:36:35<10:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14942/15526 [4:36:36<10:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14942/15526 [4:36:36<10:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14943/15526 [4:36:36<10:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14943/15526 [4:36:36<10:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14944/15526 [4:36:44<10:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14944/15526 [4:36:44<10:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14945/15526 [4:36:44<10:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14945/15526 [4:36:44<10:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14946/15526 [4:36:45<10:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14946/15526 [4:36:45<10:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14947/15526 [4:36:46<10:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14947/15526 [4:36:46<10:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14948/15526 [4:36:47<10:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14948/15526 [4:36:47<10:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14949/15526 [4:36:48<10:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14949/15526 [4:36:48<10:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14950/15526 [4:36:49<10:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14950/15526 [4:36:49<10:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14951/15526 [4:36:49<10:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14951/15526 [4:36:49<10:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14952/15526 [4:36:51<10:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14952/15526 [4:36:51<10:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14953/15526 [4:36:51<10:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14953/15526 [4:36:51<10:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14954/15526 [4:36:52<10:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14954/15526 [4:36:52<10:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14955/15526 [4:36:53<10:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14955/15526 [4:36:53<10:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14956/15526 [4:36:54<10:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14956/15526 [4:36:54<10:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14957/15526 [4:36:55<10:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14957/15526 [4:36:55<10:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14958/15526 [4:36:56<10:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14958/15526 [4:36:56<10:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14959/15526 [4:36:56<10:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14959/15526 [4:36:56<10:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14960/15526 [4:36:57<10:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14960/15526 [4:36:57<10:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14961/15526 [4:36:58<10:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14961/15526 [4:36:58<10:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14962/15526 [4:36:58<10:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14962/15526 [4:36:58<10:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14963/15526 [4:36:59<10:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14963/15526 [4:36:59<10:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14964/15526 [4:37:00<10:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14964/15526 [4:37:00<10:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14965/15526 [4:37:00<10:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14965/15526 [4:37:00<10:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14966/15526 [4:37:02<10:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14966/15526 [4:37:02<10:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14967/15526 [4:37:02<10:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14967/15526 [4:37:02<10:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14968/15526 [4:37:03<10:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14968/15526 [4:37:03<10:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14969/15526 [4:37:04<10:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14969/15526 [4:37:04<10:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14970/15526 [4:37:05<10:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14970/15526 [4:37:05<10:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14971/15526 [4:37:06<10:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14971/15526 [4:37:06<10:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14972/15526 [4:37:07<10:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14972/15526 [4:37:07<10:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14973/15526 [4:37:07<10:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14973/15526 [4:37:07<10:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14974/15526 [4:37:08<10:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14974/15526 [4:37:08<10:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14975/15526 [4:37:09<10:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14975/15526 [4:37:09<10:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14976/15526 [4:37:18<10:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14976/15526 [4:37:18<10:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14977/15526 [4:37:19<10:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14977/15526 [4:37:19<10:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14978/15526 [4:37:20<10:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14978/15526 [4:37:20<10:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14979/15526 [4:37:21<10:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14979/15526 [4:37:21<10:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14980/15526 [4:37:21<10:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14980/15526 [4:37:21<10:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14981/15526 [4:37:22<10:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  96%|▉| 14981/15526 [4:37:22<10:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 14982/15526 [4:37:23<10:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|���| 14982/15526 [4:37:23<10:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 14983/15526 [4:37:24<10:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 14983/15526 [4:37:24<10:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 14984/15526 [4:37:25<10:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 14984/15526 [4:37:25<10:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 14985/15526 [4:37:26<10:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 14985/15526 [4:37:26<10:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 14986/15526 [4:37:26<09:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 14986/15526 [4:37:26<09:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 14987/15526 [4:37:27<09:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 14987/15526 [4:37:27<09:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 14988/15526 [4:37:28<09:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 14988/15526 [4:37:28<09:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 14989/15526 [4:37:29<09:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 14989/15526 [4:37:29<09:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 14990/15526 [4:37:30<09:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 14990/15526 [4:37:30<09:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 14991/15526 [4:37:31<09:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 14991/15526 [4:37:31<09:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 14992/15526 [4:37:32<09:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 14992/15526 [4:37:32<09:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 14993/15526 [4:37:33<09:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 14993/15526 [4:37:33<09:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 14994/15526 [4:37:34<09:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 14994/15526 [4:37:34<09:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 14995/15526 [4:37:35<09:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 14995/15526 [4:37:35<09:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 14996/15526 [4:37:35<09:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 14996/15526 [4:37:35<09:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 14997/15526 [4:37:36<09:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 14997/15526 [4:37:36<09:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 14998/15526 [4:37:37<09:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 14998/15526 [4:37:37<09:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 14999/15526 [4:37:37<09:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 14999/15526 [4:37:37<09:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15000/15526 [4:37:38<09:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15000/15526 [4:37:38<09:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15001/15526 [4:37:39<09:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15001/15526 [4:37:39<09:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15002/15526 [4:37:40<09:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15002/15526 [4:37:40<09:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15003/15526 [4:37:41<09:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15003/15526 [4:37:41<09:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15004/15526 [4:37:41<09:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15004/15526 [4:37:41<09:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15005/15526 [4:37:42<09:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15005/15526 [4:37:42<09:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15006/15526 [4:37:42<09:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15006/15526 [4:37:42<09:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15007/15526 [4:37:43<09:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15007/15526 [4:37:43<09:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15008/15526 [4:37:52<09:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15008/15526 [4:37:52<09:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15009/15526 [4:37:53<09:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15009/15526 [4:37:53<09:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15010/15526 [4:37:53<09:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15010/15526 [4:37:53<09:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15011/15526 [4:37:54<09:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15011/15526 [4:37:54<09:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15012/15526 [4:37:55<09:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15012/15526 [4:37:55<09:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15013/15526 [4:37:56<09:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15013/15526 [4:37:56<09:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15014/15526 [4:37:57<09:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15014/15526 [4:37:57<09:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15015/15526 [4:37:58<09:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15015/15526 [4:37:58<09:27,  1.11s/it, v_num=73vx, train/loss=8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15016/15526 [4:37:58<09:26,  1.11s/it, v_num=73vx, train/loss=8\r",
-      "Epoch 0:  97%|▉| 15016/15526 [4:37:58<09:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15017/15526 [4:37:59<09:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15017/15526 [4:37:59<09:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15018/15526 [4:38:00<09:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15018/15526 [4:38:00<09:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15019/15526 [4:38:01<09:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15019/15526 [4:38:01<09:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15020/15526 [4:38:02<09:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15020/15526 [4:38:02<09:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15021/15526 [4:38:03<09:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15021/15526 [4:38:03<09:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15022/15526 [4:38:04<09:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15022/15526 [4:38:04<09:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15023/15526 [4:38:05<09:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15023/15526 [4:38:05<09:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15024/15526 [4:38:05<09:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15024/15526 [4:38:05<09:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15025/15526 [4:38:06<09:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15025/15526 [4:38:06<09:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15026/15526 [4:38:07<09:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15026/15526 [4:38:07<09:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15027/15526 [4:38:07<09:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15027/15526 [4:38:07<09:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15028/15526 [4:38:08<09:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15028/15526 [4:38:08<09:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15029/15526 [4:38:09<09:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15029/15526 [4:38:09<09:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15030/15526 [4:38:10<09:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15030/15526 [4:38:10<09:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15031/15526 [4:38:10<09:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15031/15526 [4:38:10<09:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15032/15526 [4:38:11<09:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15032/15526 [4:38:11<09:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15033/15526 [4:38:12<09:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15033/15526 [4:38:12<09:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15034/15526 [4:38:13<09:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15034/15526 [4:38:13<09:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15035/15526 [4:38:14<09:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15035/15526 [4:38:14<09:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15036/15526 [4:38:15<09:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15036/15526 [4:38:15<09:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15037/15526 [4:38:16<09:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15037/15526 [4:38:16<09:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15038/15526 [4:38:17<09:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15038/15526 [4:38:17<09:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15039/15526 [4:38:18<09:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15039/15526 [4:38:18<09:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15040/15526 [4:38:27<08:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15040/15526 [4:38:27<08:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15041/15526 [4:38:28<08:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15041/15526 [4:38:28<08:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15042/15526 [4:38:29<08:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15042/15526 [4:38:29<08:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15043/15526 [4:38:30<08:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15043/15526 [4:38:30<08:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15044/15526 [4:38:31<08:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15044/15526 [4:38:31<08:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15045/15526 [4:38:31<08:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15045/15526 [4:38:31<08:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15046/15526 [4:38:32<08:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15046/15526 [4:38:32<08:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15047/15526 [4:38:33<08:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15047/15526 [4:38:33<08:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15048/15526 [4:38:34<08:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15048/15526 [4:38:34<08:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15049/15526 [4:38:35<08:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15049/15526 [4:38:35<08:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15050/15526 [4:38:36<08:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15050/15526 [4:38:36<08:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15051/15526 [4:38:37<08:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15051/15526 [4:38:37<08:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15052/15526 [4:38:38<08:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15052/15526 [4:38:38<08:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15053/15526 [4:38:38<08:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15053/15526 [4:38:38<08:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15054/15526 [4:38:39<08:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15054/15526 [4:38:39<08:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15055/15526 [4:38:40<08:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15055/15526 [4:38:40<08:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15056/15526 [4:38:41<08:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15056/15526 [4:38:41<08:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15057/15526 [4:38:42<08:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15057/15526 [4:38:42<08:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15058/15526 [4:38:43<08:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15058/15526 [4:38:43<08:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15059/15526 [4:38:43<08:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15059/15526 [4:38:43<08:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15060/15526 [4:38:45<08:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15060/15526 [4:38:45<08:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15061/15526 [4:38:45<08:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15061/15526 [4:38:45<08:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15062/15526 [4:38:46<08:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15062/15526 [4:38:46<08:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15063/15526 [4:38:47<08:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15063/15526 [4:38:47<08:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15064/15526 [4:38:48<08:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15064/15526 [4:38:48<08:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15065/15526 [4:38:48<08:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15065/15526 [4:38:48<08:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15066/15526 [4:38:50<08:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15066/15526 [4:38:50<08:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15067/15526 [4:38:50<08:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15067/15526 [4:38:50<08:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15068/15526 [4:38:51<08:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15068/15526 [4:38:51<08:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15069/15526 [4:38:52<08:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15069/15526 [4:38:52<08:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15070/15526 [4:38:53<08:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15070/15526 [4:38:53<08:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15071/15526 [4:38:54<08:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15071/15526 [4:38:54<08:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15072/15526 [4:39:01<08:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15072/15526 [4:39:01<08:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15073/15526 [4:39:02<08:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15073/15526 [4:39:02<08:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15074/15526 [4:39:03<08:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15074/15526 [4:39:03<08:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15075/15526 [4:39:04<08:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15075/15526 [4:39:04<08:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15076/15526 [4:39:05<08:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15076/15526 [4:39:05<08:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15077/15526 [4:39:06<08:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15077/15526 [4:39:06<08:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15078/15526 [4:39:06<08:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15078/15526 [4:39:06<08:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15079/15526 [4:39:07<08:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15079/15526 [4:39:07<08:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15080/15526 [4:39:08<08:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15080/15526 [4:39:08<08:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15081/15526 [4:39:10<08:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15081/15526 [4:39:10<08:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15082/15526 [4:39:10<08:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15082/15526 [4:39:10<08:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15083/15526 [4:39:11<08:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15083/15526 [4:39:11<08:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15084/15526 [4:39:12<08:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15084/15526 [4:39:12<08:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15085/15526 [4:39:13<08:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15085/15526 [4:39:13<08:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15086/15526 [4:39:14<08:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15086/15526 [4:39:14<08:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15087/15526 [4:39:14<08:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15087/15526 [4:39:14<08:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15088/15526 [4:39:15<08:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15088/15526 [4:39:15<08:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15089/15526 [4:39:16<08:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15089/15526 [4:39:16<08:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15090/15526 [4:39:17<08:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15090/15526 [4:39:17<08:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15091/15526 [4:39:17<08:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15091/15526 [4:39:17<08:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15092/15526 [4:39:18<08:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15092/15526 [4:39:18<08:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15093/15526 [4:39:19<08:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15093/15526 [4:39:19<08:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15094/15526 [4:39:20<07:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15094/15526 [4:39:20<07:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15095/15526 [4:39:20<07:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15095/15526 [4:39:20<07:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15096/15526 [4:39:21<07:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15096/15526 [4:39:21<07:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15097/15526 [4:39:22<07:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15097/15526 [4:39:22<07:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15098/15526 [4:39:23<07:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15098/15526 [4:39:23<07:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15099/15526 [4:39:23<07:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15099/15526 [4:39:23<07:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15100/15526 [4:39:25<07:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15100/15526 [4:39:25<07:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15101/15526 [4:39:26<07:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15101/15526 [4:39:26<07:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15102/15526 [4:39:27<07:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15102/15526 [4:39:27<07:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15103/15526 [4:39:27<07:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15103/15526 [4:39:27<07:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15104/15526 [4:39:34<07:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15104/15526 [4:39:34<07:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15105/15526 [4:39:36<07:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15105/15526 [4:39:36<07:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15106/15526 [4:39:36<07:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15106/15526 [4:39:36<07:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15107/15526 [4:39:37<07:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15107/15526 [4:39:37<07:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15108/15526 [4:39:38<07:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15108/15526 [4:39:38<07:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15109/15526 [4:39:38<07:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15109/15526 [4:39:38<07:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15110/15526 [4:39:39<07:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15110/15526 [4:39:39<07:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15111/15526 [4:39:40<07:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15111/15526 [4:39:40<07:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15112/15526 [4:39:40<07:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15112/15526 [4:39:40<07:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15113/15526 [4:39:42<07:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15113/15526 [4:39:42<07:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15114/15526 [4:39:43<07:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15114/15526 [4:39:43<07:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15115/15526 [4:39:44<07:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15115/15526 [4:39:44<07:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15116/15526 [4:39:45<07:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15116/15526 [4:39:45<07:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15117/15526 [4:39:46<07:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15117/15526 [4:39:46<07:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15118/15526 [4:39:47<07:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15118/15526 [4:39:47<07:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15119/15526 [4:39:48<07:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15119/15526 [4:39:48<07:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15120/15526 [4:39:49<07:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15120/15526 [4:39:49<07:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15121/15526 [4:39:50<07:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15121/15526 [4:39:50<07:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15122/15526 [4:39:50<07:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15122/15526 [4:39:50<07:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15123/15526 [4:39:51<07:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15123/15526 [4:39:51<07:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15124/15526 [4:39:52<07:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15124/15526 [4:39:52<07:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15125/15526 [4:39:54<07:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15125/15526 [4:39:54<07:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15126/15526 [4:39:55<07:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15126/15526 [4:39:55<07:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15127/15526 [4:39:55<07:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15127/15526 [4:39:55<07:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15128/15526 [4:39:56<07:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15128/15526 [4:39:56<07:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15129/15526 [4:39:57<07:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15129/15526 [4:39:57<07:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15130/15526 [4:39:57<07:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15130/15526 [4:39:57<07:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15131/15526 [4:39:58<07:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15131/15526 [4:39:58<07:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15132/15526 [4:39:59<07:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15132/15526 [4:39:59<07:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15133/15526 [4:40:00<07:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15133/15526 [4:40:00<07:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15134/15526 [4:40:01<07:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15134/15526 [4:40:01<07:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15135/15526 [4:40:02<07:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15135/15526 [4:40:02<07:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15136/15526 [4:40:10<07:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15136/15526 [4:40:10<07:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 15137/15526 [4:40:11<07:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  97%|▉| 15137/15526 [4:40:11<07:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15138/15526 [4:40:12<07:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15138/15526 [4:40:12<07:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15139/15526 [4:40:13<07:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15139/15526 [4:40:13<07:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15140/15526 [4:40:14<07:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15140/15526 [4:40:14<07:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15141/15526 [4:40:15<07:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15141/15526 [4:40:15<07:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15142/15526 [4:40:16<07:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15142/15526 [4:40:16<07:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15143/15526 [4:40:17<07:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15143/15526 [4:40:17<07:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15144/15526 [4:40:18<07:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15144/15526 [4:40:18<07:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15145/15526 [4:40:18<07:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15145/15526 [4:40:18<07:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15146/15526 [4:40:20<07:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15146/15526 [4:40:20<07:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15147/15526 [4:40:20<07:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15147/15526 [4:40:20<07:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15148/15526 [4:40:21<06:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15148/15526 [4:40:21<06:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15149/15526 [4:40:22<06:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15149/15526 [4:40:22<06:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15150/15526 [4:40:22<06:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15150/15526 [4:40:22<06:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15151/15526 [4:40:23<06:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15151/15526 [4:40:23<06:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15152/15526 [4:40:24<06:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15152/15526 [4:40:24<06:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15153/15526 [4:40:24<06:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15153/15526 [4:40:24<06:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15154/15526 [4:40:25<06:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15154/15526 [4:40:25<06:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15155/15526 [4:40:26<06:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15155/15526 [4:40:26<06:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15156/15526 [4:40:27<06:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15156/15526 [4:40:27<06:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15157/15526 [4:40:28<06:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15157/15526 [4:40:28<06:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15158/15526 [4:40:29<06:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15158/15526 [4:40:29<06:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15159/15526 [4:40:30<06:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15159/15526 [4:40:30<06:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15160/15526 [4:40:30<06:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15160/15526 [4:40:30<06:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15161/15526 [4:40:31<06:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15161/15526 [4:40:31<06:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15162/15526 [4:40:32<06:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15162/15526 [4:40:32<06:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15163/15526 [4:40:33<06:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15163/15526 [4:40:33<06:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15164/15526 [4:40:34<06:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15164/15526 [4:40:34<06:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15165/15526 [4:40:35<06:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15165/15526 [4:40:35<06:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15166/15526 [4:40:35<06:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15166/15526 [4:40:35<06:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15167/15526 [4:40:36<06:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15167/15526 [4:40:36<06:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15168/15526 [4:40:44<06:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15168/15526 [4:40:44<06:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15169/15526 [4:40:45<06:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15169/15526 [4:40:45<06:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15170/15526 [4:40:45<06:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15170/15526 [4:40:45<06:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15171/15526 [4:40:46<06:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15171/15526 [4:40:46<06:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15172/15526 [4:40:47<06:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15172/15526 [4:40:47<06:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15173/15526 [4:40:48<06:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15173/15526 [4:40:48<06:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15174/15526 [4:40:49<06:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15174/15526 [4:40:49<06:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15175/15526 [4:40:50<06:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15175/15526 [4:40:50<06:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15176/15526 [4:40:51<06:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15176/15526 [4:40:51<06:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15177/15526 [4:40:52<06:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15177/15526 [4:40:52<06:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15178/15526 [4:40:52<06:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15178/15526 [4:40:52<06:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15179/15526 [4:40:53<06:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15179/15526 [4:40:53<06:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15180/15526 [4:40:54<06:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15180/15526 [4:40:54<06:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15181/15526 [4:40:55<06:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15181/15526 [4:40:55<06:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15182/15526 [4:40:57<06:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15182/15526 [4:40:57<06:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15183/15526 [4:40:58<06:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15183/15526 [4:40:58<06:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15184/15526 [4:40:58<06:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15184/15526 [4:40:58<06:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15185/15526 [4:40:59<06:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15185/15526 [4:40:59<06:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15186/15526 [4:41:00<06:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15186/15526 [4:41:00<06:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15187/15526 [4:41:00<06:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15187/15526 [4:41:00<06:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15188/15526 [4:41:01<06:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15188/15526 [4:41:01<06:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15189/15526 [4:41:02<06:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15189/15526 [4:41:02<06:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15190/15526 [4:41:02<06:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15190/15526 [4:41:02<06:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15191/15526 [4:41:04<06:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15191/15526 [4:41:04<06:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15192/15526 [4:41:04<06:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15192/15526 [4:41:04<06:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15193/15526 [4:41:06<06:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15193/15526 [4:41:06<06:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15194/15526 [4:41:06<06:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15194/15526 [4:41:06<06:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15195/15526 [4:41:07<06:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15195/15526 [4:41:07<06:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15196/15526 [4:41:08<06:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15196/15526 [4:41:08<06:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15197/15526 [4:41:09<06:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15197/15526 [4:41:09<06:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15198/15526 [4:41:10<06:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15198/15526 [4:41:10<06:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15199/15526 [4:41:10<06:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15199/15526 [4:41:10<06:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15200/15526 [4:41:18<06:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15200/15526 [4:41:18<06:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15201/15526 [4:41:41<06:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15201/15526 [4:41:41<06:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15202/15526 [4:41:42<06:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15202/15526 [4:41:42<06:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15203/15526 [4:41:43<05:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15203/15526 [4:41:43<05:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15204/15526 [4:41:44<05:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15204/15526 [4:41:44<05:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15205/15526 [4:41:45<05:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15205/15526 [4:41:45<05:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15206/15526 [4:41:46<05:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15206/15526 [4:41:46<05:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15207/15526 [4:41:46<05:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15207/15526 [4:41:46<05:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15208/15526 [4:41:47<05:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15208/15526 [4:41:47<05:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15209/15526 [4:41:48<05:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15209/15526 [4:41:48<05:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15210/15526 [4:41:49<05:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15210/15526 [4:41:49<05:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15211/15526 [4:41:50<05:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15211/15526 [4:41:50<05:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15212/15526 [4:41:51<05:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15212/15526 [4:41:51<05:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15213/15526 [4:41:52<05:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15213/15526 [4:41:52<05:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15214/15526 [4:41:53<05:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15214/15526 [4:41:53<05:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15215/15526 [4:41:54<05:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15215/15526 [4:41:54<05:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15216/15526 [4:41:54<05:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15216/15526 [4:41:54<05:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15217/15526 [4:41:55<05:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15217/15526 [4:41:55<05:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15218/15526 [4:41:56<05:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15218/15526 [4:41:56<05:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15219/15526 [4:41:57<05:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15219/15526 [4:41:57<05:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15220/15526 [4:41:58<05:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15220/15526 [4:41:58<05:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15221/15526 [4:41:59<05:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15221/15526 [4:41:59<05:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15222/15526 [4:42:00<05:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15222/15526 [4:42:00<05:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15223/15526 [4:42:01<05:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15223/15526 [4:42:01<05:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15224/15526 [4:42:02<05:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15224/15526 [4:42:02<05:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15225/15526 [4:42:02<05:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15225/15526 [4:42:02<05:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15226/15526 [4:42:03<05:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15226/15526 [4:42:03<05:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15227/15526 [4:42:04<05:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15227/15526 [4:42:04<05:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15228/15526 [4:42:05<05:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15228/15526 [4:42:05<05:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15229/15526 [4:42:06<05:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15229/15526 [4:42:06<05:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15230/15526 [4:42:07<05:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15230/15526 [4:42:07<05:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15231/15526 [4:42:08<05:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15231/15526 [4:42:08<05:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15232/15526 [4:42:14<05:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15232/15526 [4:42:14<05:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15233/15526 [4:42:15<05:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15233/15526 [4:42:15<05:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15234/15526 [4:42:15<05:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15234/15526 [4:42:15<05:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15235/15526 [4:42:16<05:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15235/15526 [4:42:16<05:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15236/15526 [4:42:17<05:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15236/15526 [4:42:17<05:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15237/15526 [4:42:18<05:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15237/15526 [4:42:18<05:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15238/15526 [4:42:19<05:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15238/15526 [4:42:19<05:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15239/15526 [4:42:20<05:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15239/15526 [4:42:20<05:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15240/15526 [4:42:21<05:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15240/15526 [4:42:21<05:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15241/15526 [4:42:21<05:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15241/15526 [4:42:21<05:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15242/15526 [4:42:22<05:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15242/15526 [4:42:22<05:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15243/15526 [4:42:23<05:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15243/15526 [4:42:23<05:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15244/15526 [4:42:23<05:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15244/15526 [4:42:23<05:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15245/15526 [4:42:24<05:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15245/15526 [4:42:24<05:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15246/15526 [4:42:25<05:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15246/15526 [4:42:25<05:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15247/15526 [4:42:25<05:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15247/15526 [4:42:25<05:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15248/15526 [4:42:26<05:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15248/15526 [4:42:26<05:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15249/15526 [4:42:27<05:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15249/15526 [4:42:27<05:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15250/15526 [4:42:28<05:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15250/15526 [4:42:28<05:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15251/15526 [4:42:29<05:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15251/15526 [4:42:29<05:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15252/15526 [4:42:30<05:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15252/15526 [4:42:30<05:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15253/15526 [4:42:32<05:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15253/15526 [4:42:32<05:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15254/15526 [4:42:33<05:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15254/15526 [4:42:33<05:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15255/15526 [4:42:33<05:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15255/15526 [4:42:33<05:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15256/15526 [4:42:34<05:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15256/15526 [4:42:34<05:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15257/15526 [4:42:35<04:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15257/15526 [4:42:35<04:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15258/15526 [4:42:35<04:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15258/15526 [4:42:35<04:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15259/15526 [4:42:37<04:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15259/15526 [4:42:37<04:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15260/15526 [4:42:38<04:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15260/15526 [4:42:38<04:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15261/15526 [4:42:38<04:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15261/15526 [4:42:38<04:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15262/15526 [4:42:39<04:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15262/15526 [4:42:39<04:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15263/15526 [4:42:40<04:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15263/15526 [4:42:40<04:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15264/15526 [4:42:47<04:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15264/15526 [4:42:47<04:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15265/15526 [4:42:48<04:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15265/15526 [4:42:48<04:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15266/15526 [4:42:48<04:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15266/15526 [4:42:48<04:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15267/15526 [4:42:49<04:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15267/15526 [4:42:49<04:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15268/15526 [4:42:50<04:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15268/15526 [4:42:50<04:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15269/15526 [4:42:50<04:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15269/15526 [4:42:50<04:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15270/15526 [4:42:52<04:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15270/15526 [4:42:52<04:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15271/15526 [4:42:53<04:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15271/15526 [4:42:53<04:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15272/15526 [4:42:54<04:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15272/15526 [4:42:54<04:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15273/15526 [4:42:55<04:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15273/15526 [4:42:55<04:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15274/15526 [4:42:55<04:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15274/15526 [4:42:55<04:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15275/15526 [4:42:56<04:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15275/15526 [4:42:56<04:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15276/15526 [4:42:58<04:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15276/15526 [4:42:58<04:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15277/15526 [4:42:58<04:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15277/15526 [4:42:58<04:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15278/15526 [4:42:59<04:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15278/15526 [4:42:59<04:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15279/15526 [4:43:00<04:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15279/15526 [4:43:00<04:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15280/15526 [4:43:01<04:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15280/15526 [4:43:01<04:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15281/15526 [4:43:02<04:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15281/15526 [4:43:02<04:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15282/15526 [4:43:03<04:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15282/15526 [4:43:03<04:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15283/15526 [4:43:04<04:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15283/15526 [4:43:04<04:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15284/15526 [4:43:05<04:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15284/15526 [4:43:05<04:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15285/15526 [4:43:06<04:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15285/15526 [4:43:06<04:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15286/15526 [4:43:07<04:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15286/15526 [4:43:07<04:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15287/15526 [4:43:07<04:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15287/15526 [4:43:07<04:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15288/15526 [4:43:08<04:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15288/15526 [4:43:08<04:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15289/15526 [4:43:09<04:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15289/15526 [4:43:09<04:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15290/15526 [4:43:10<04:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15290/15526 [4:43:10<04:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15291/15526 [4:43:10<04:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15291/15526 [4:43:10<04:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15292/15526 [4:43:12<04:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15292/15526 [4:43:12<04:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 15293/15526 [4:43:12<04:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  98%|▉| 15293/15526 [4:43:12<04:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15294/15526 [4:43:13<04:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15294/15526 [4:43:13<04:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15295/15526 [4:43:14<04:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15295/15526 [4:43:14<04:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15296/15526 [4:43:22<04:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15296/15526 [4:43:22<04:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15297/15526 [4:43:22<04:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15297/15526 [4:43:22<04:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15298/15526 [4:43:23<04:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15298/15526 [4:43:23<04:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15299/15526 [4:43:24<04:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15299/15526 [4:43:24<04:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15300/15526 [4:43:25<04:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15300/15526 [4:43:25<04:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15301/15526 [4:43:26<04:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15301/15526 [4:43:26<04:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15302/15526 [4:43:27<04:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15302/15526 [4:43:27<04:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15303/15526 [4:43:28<04:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15303/15526 [4:43:28<04:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15304/15526 [4:43:28<04:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15304/15526 [4:43:28<04:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15305/15526 [4:43:29<04:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15305/15526 [4:43:29<04:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15306/15526 [4:43:30<04:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15306/15526 [4:43:30<04:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15307/15526 [4:43:31<04:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15307/15526 [4:43:31<04:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15308/15526 [4:43:32<04:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15308/15526 [4:43:32<04:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15309/15526 [4:43:32<04:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15309/15526 [4:43:32<04:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15310/15526 [4:43:33<04:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15310/15526 [4:43:33<04:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15311/15526 [4:43:34<03:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15311/15526 [4:43:34<03:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15312/15526 [4:43:34<03:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15312/15526 [4:43:34<03:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15313/15526 [4:43:36<03:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15313/15526 [4:43:36<03:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15314/15526 [4:43:36<03:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15314/15526 [4:43:36<03:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15315/15526 [4:43:37<03:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15315/15526 [4:43:37<03:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15316/15526 [4:43:38<03:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15316/15526 [4:43:38<03:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15317/15526 [4:43:39<03:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15317/15526 [4:43:39<03:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15318/15526 [4:43:40<03:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15318/15526 [4:43:40<03:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15319/15526 [4:43:41<03:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15319/15526 [4:43:41<03:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15320/15526 [4:43:41<03:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15320/15526 [4:43:41<03:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15321/15526 [4:43:42<03:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15321/15526 [4:43:42<03:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15322/15526 [4:43:43<03:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15322/15526 [4:43:43<03:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15323/15526 [4:43:45<03:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15323/15526 [4:43:45<03:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15324/15526 [4:43:46<03:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15324/15526 [4:43:46<03:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15325/15526 [4:43:47<03:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15325/15526 [4:43:47<03:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15326/15526 [4:43:48<03:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15326/15526 [4:43:48<03:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15327/15526 [4:43:48<03:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15327/15526 [4:43:48<03:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15328/15526 [4:43:58<03:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15328/15526 [4:43:58<03:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15329/15526 [4:43:59<03:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15329/15526 [4:43:59<03:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15330/15526 [4:44:00<03:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15330/15526 [4:44:00<03:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15331/15526 [4:44:01<03:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15331/15526 [4:44:01<03:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15332/15526 [4:44:01<03:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15332/15526 [4:44:01<03:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15333/15526 [4:44:02<03:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15333/15526 [4:44:02<03:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15334/15526 [4:44:04<03:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15334/15526 [4:44:04<03:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15335/15526 [4:44:05<03:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15335/15526 [4:44:05<03:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15336/15526 [4:44:06<03:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15336/15526 [4:44:06<03:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15337/15526 [4:44:06<03:30,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15337/15526 [4:44:06<03:30,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15338/15526 [4:44:07<03:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15338/15526 [4:44:07<03:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15339/15526 [4:44:08<03:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15339/15526 [4:44:08<03:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15340/15526 [4:44:09<03:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15340/15526 [4:44:09<03:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15341/15526 [4:44:09<03:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15341/15526 [4:44:09<03:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15342/15526 [4:44:11<03:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15342/15526 [4:44:11<03:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15343/15526 [4:44:11<03:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15343/15526 [4:44:11<03:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15344/15526 [4:44:12<03:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15344/15526 [4:44:12<03:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15345/15526 [4:44:13<03:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15345/15526 [4:44:13<03:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15346/15526 [4:44:13<03:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15346/15526 [4:44:13<03:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15347/15526 [4:44:14<03:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15347/15526 [4:44:14<03:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15348/15526 [4:44:15<03:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15348/15526 [4:44:15<03:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15349/15526 [4:44:16<03:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15349/15526 [4:44:16<03:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15350/15526 [4:44:17<03:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15350/15526 [4:44:17<03:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15351/15526 [4:44:17<03:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15351/15526 [4:44:17<03:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15352/15526 [4:44:18<03:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15352/15526 [4:44:18<03:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15353/15526 [4:44:19<03:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15353/15526 [4:44:19<03:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15354/15526 [4:44:20<03:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15354/15526 [4:44:20<03:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15355/15526 [4:44:21<03:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15355/15526 [4:44:21<03:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15356/15526 [4:44:22<03:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15356/15526 [4:44:22<03:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15357/15526 [4:44:22<03:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15357/15526 [4:44:22<03:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15358/15526 [4:44:23<03:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15358/15526 [4:44:23<03:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15359/15526 [4:44:24<03:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15359/15526 [4:44:24<03:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15360/15526 [4:44:32<03:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15360/15526 [4:44:32<03:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15361/15526 [4:44:33<03:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15361/15526 [4:44:33<03:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15362/15526 [4:44:34<03:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15362/15526 [4:44:34<03:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15363/15526 [4:44:35<03:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15363/15526 [4:44:35<03:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15364/15526 [4:44:35<03:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15364/15526 [4:44:35<03:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15365/15526 [4:44:36<02:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15365/15526 [4:44:36<02:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15366/15526 [4:44:37<02:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15366/15526 [4:44:37<02:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15367/15526 [4:44:38<02:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15367/15526 [4:44:38<02:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15368/15526 [4:44:39<02:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15368/15526 [4:44:39<02:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15369/15526 [4:44:39<02:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15369/15526 [4:44:39<02:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15370/15526 [4:44:40<02:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15370/15526 [4:44:40<02:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15371/15526 [4:44:41<02:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15371/15526 [4:44:41<02:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15372/15526 [4:44:42<02:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15372/15526 [4:44:42<02:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15373/15526 [4:44:42<02:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15373/15526 [4:44:42<02:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15374/15526 [4:44:43<02:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15374/15526 [4:44:43<02:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15375/15526 [4:44:44<02:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15375/15526 [4:44:44<02:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15376/15526 [4:44:45<02:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15376/15526 [4:44:45<02:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15377/15526 [4:44:46<02:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15377/15526 [4:44:46<02:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15378/15526 [4:44:47<02:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15378/15526 [4:44:47<02:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15379/15526 [4:44:48<02:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15379/15526 [4:44:48<02:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15380/15526 [4:44:49<02:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15380/15526 [4:44:49<02:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15381/15526 [4:44:49<02:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15381/15526 [4:44:49<02:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15382/15526 [4:44:51<02:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15382/15526 [4:44:51<02:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15383/15526 [4:44:51<02:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15383/15526 [4:44:51<02:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15384/15526 [4:44:53<02:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15384/15526 [4:44:53<02:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15385/15526 [4:44:54<02:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15385/15526 [4:44:54<02:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15386/15526 [4:44:54<02:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15386/15526 [4:44:54<02:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15387/15526 [4:44:56<02:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15387/15526 [4:44:56<02:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15388/15526 [4:44:57<02:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15388/15526 [4:44:57<02:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15389/15526 [4:44:58<02:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15389/15526 [4:44:58<02:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15390/15526 [4:44:59<02:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15390/15526 [4:44:59<02:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15391/15526 [4:45:00<02:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15391/15526 [4:45:00<02:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15392/15526 [4:45:06<02:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15392/15526 [4:45:06<02:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15393/15526 [4:45:07<02:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15393/15526 [4:45:07<02:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15394/15526 [4:45:08<02:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15394/15526 [4:45:08<02:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15395/15526 [4:45:08<02:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15395/15526 [4:45:08<02:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15396/15526 [4:45:10<02:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15396/15526 [4:45:10<02:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15397/15526 [4:45:11<02:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15397/15526 [4:45:11<02:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15398/15526 [4:45:12<02:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15398/15526 [4:45:12<02:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15399/15526 [4:45:13<02:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15399/15526 [4:45:13<02:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15400/15526 [4:45:14<02:20,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15400/15526 [4:45:14<02:20,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15401/15526 [4:45:15<02:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15401/15526 [4:45:15<02:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15402/15526 [4:45:16<02:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15402/15526 [4:45:16<02:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15403/15526 [4:45:17<02:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15403/15526 [4:45:17<02:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15404/15526 [4:45:18<02:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15404/15526 [4:45:18<02:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15405/15526 [4:45:19<02:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15405/15526 [4:45:19<02:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15406/15526 [4:45:20<02:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15406/15526 [4:45:20<02:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15407/15526 [4:45:20<02:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15407/15526 [4:45:20<02:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15408/15526 [4:45:21<02:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15408/15526 [4:45:21<02:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15409/15526 [4:45:22<02:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15409/15526 [4:45:22<02:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15410/15526 [4:45:22<02:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15410/15526 [4:45:22<02:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15411/15526 [4:45:24<02:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15411/15526 [4:45:24<02:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15412/15526 [4:45:24<02:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15412/15526 [4:45:24<02:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15413/15526 [4:45:25<02:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15413/15526 [4:45:25<02:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15414/15526 [4:45:26<02:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15414/15526 [4:45:26<02:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15415/15526 [4:45:27<02:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15415/15526 [4:45:27<02:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15416/15526 [4:45:28<02:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15416/15526 [4:45:28<02:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15417/15526 [4:45:28<02:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15417/15526 [4:45:28<02:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15418/15526 [4:45:29<01:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15418/15526 [4:45:29<01:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15419/15526 [4:45:30<01:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15419/15526 [4:45:30<01:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15420/15526 [4:45:30<01:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15420/15526 [4:45:30<01:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15421/15526 [4:45:31<01:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15421/15526 [4:45:31<01:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15422/15526 [4:45:32<01:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15422/15526 [4:45:32<01:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15423/15526 [4:45:32<01:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15423/15526 [4:45:32<01:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15424/15526 [4:45:40<01:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15424/15526 [4:45:40<01:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15425/15526 [4:45:41<01:52,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15425/15526 [4:45:41<01:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15426/15526 [4:45:41<01:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15426/15526 [4:45:41<01:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15427/15526 [4:45:43<01:50,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15427/15526 [4:45:43<01:50,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15428/15526 [4:45:44<01:48,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15428/15526 [4:45:44<01:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15429/15526 [4:45:44<01:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15429/15526 [4:45:44<01:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15430/15526 [4:45:46<01:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15430/15526 [4:45:46<01:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15431/15526 [4:45:46<01:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15431/15526 [4:45:46<01:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15432/15526 [4:45:47<01:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15432/15526 [4:45:47<01:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15433/15526 [4:45:48<01:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15433/15526 [4:45:48<01:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15434/15526 [4:45:49<01:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15434/15526 [4:45:49<01:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15435/15526 [4:45:49<01:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15435/15526 [4:45:49<01:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15436/15526 [4:45:51<01:40,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15436/15526 [4:45:51<01:40,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15437/15526 [4:45:51<01:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15437/15526 [4:45:51<01:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15438/15526 [4:45:52<01:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15438/15526 [4:45:52<01:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15439/15526 [4:45:53<01:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15439/15526 [4:45:53<01:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15440/15526 [4:45:54<01:35,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15440/15526 [4:45:54<01:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15441/15526 [4:45:55<01:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15441/15526 [4:45:55<01:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15442/15526 [4:45:56<01:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15442/15526 [4:45:56<01:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15443/15526 [4:45:56<01:32,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15443/15526 [4:45:56<01:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15444/15526 [4:45:57<01:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15444/15526 [4:45:57<01:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15445/15526 [4:45:58<01:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15445/15526 [4:45:58<01:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15446/15526 [4:45:59<01:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15446/15526 [4:45:59<01:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15447/15526 [4:46:00<01:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15447/15526 [4:46:00<01:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 15448/15526 [4:46:01<01:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0:  99%|▉| 15448/15526 [4:46:01<01:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15449/15526 [4:46:02<01:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15449/15526 [4:46:02<01:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15450/15526 [4:46:03<01:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15450/15526 [4:46:03<01:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15451/15526 [4:46:04<01:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15451/15526 [4:46:04<01:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15452/15526 [4:46:05<01:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15452/15526 [4:46:05<01:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15453/15526 [4:46:06<01:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15453/15526 [4:46:06<01:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15454/15526 [4:46:07<01:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15454/15526 [4:46:07<01:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15455/15526 [4:46:08<01:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15455/15526 [4:46:08<01:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15456/15526 [4:46:14<01:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15456/15526 [4:46:14<01:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15457/15526 [4:46:16<01:16,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15457/15526 [4:46:16<01:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15458/15526 [4:46:17<01:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15458/15526 [4:46:17<01:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15459/15526 [4:46:17<01:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15459/15526 [4:46:17<01:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15460/15526 [4:46:18<01:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15460/15526 [4:46:18<01:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15461/15526 [4:46:19<01:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15461/15526 [4:46:19<01:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15462/15526 [4:46:19<01:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15462/15526 [4:46:19<01:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15463/15526 [4:46:21<01:10,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15463/15526 [4:46:21<01:10,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15464/15526 [4:46:21<01:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15464/15526 [4:46:21<01:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15465/15526 [4:46:23<01:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15465/15526 [4:46:23<01:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15466/15526 [4:46:23<01:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15466/15526 [4:46:23<01:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15467/15526 [4:46:24<01:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15467/15526 [4:46:24<01:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15468/15526 [4:46:25<01:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15468/15526 [4:46:25<01:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15469/15526 [4:46:26<01:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15469/15526 [4:46:26<01:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15470/15526 [4:46:27<01:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15470/15526 [4:46:27<01:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15471/15526 [4:46:28<01:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15471/15526 [4:46:28<01:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15472/15526 [4:46:28<00:59,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15472/15526 [4:46:28<00:59,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15473/15526 [4:46:29<00:58,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15473/15526 [4:46:29<00:58,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15474/15526 [4:46:30<00:57,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15474/15526 [4:46:30<00:57,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15475/15526 [4:46:32<00:56,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15475/15526 [4:46:32<00:56,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15476/15526 [4:46:32<00:55,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15476/15526 [4:46:32<00:55,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15477/15526 [4:46:33<00:54,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15477/15526 [4:46:33<00:54,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15478/15526 [4:46:34<00:53,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15478/15526 [4:46:34<00:53,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15479/15526 [4:46:35<00:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15479/15526 [4:46:35<00:52,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15480/15526 [4:46:36<00:51,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15480/15526 [4:46:36<00:51,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15481/15526 [4:46:36<00:49,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15481/15526 [4:46:36<00:49,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15482/15526 [4:46:37<00:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15482/15526 [4:46:37<00:48,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15483/15526 [4:46:38<00:47,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15483/15526 [4:46:38<00:47,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15484/15526 [4:46:39<00:46,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15484/15526 [4:46:39<00:46,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15485/15526 [4:46:40<00:45,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15485/15526 [4:46:40<00:45,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15486/15526 [4:46:40<00:44,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15486/15526 [4:46:40<00:44,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15487/15526 [4:46:41<00:43,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15487/15526 [4:46:41<00:43,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15488/15526 [4:46:49<00:42,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15488/15526 [4:46:49<00:42,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15489/15526 [4:46:50<00:41,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15489/15526 [4:46:50<00:41,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15490/15526 [4:46:50<00:39,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15490/15526 [4:46:50<00:39,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15491/15526 [4:46:51<00:38,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15491/15526 [4:46:51<00:38,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15492/15526 [4:46:52<00:37,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15492/15526 [4:46:52<00:37,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15493/15526 [4:46:53<00:36,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15493/15526 [4:46:53<00:36,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15494/15526 [4:46:54<00:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15494/15526 [4:46:54<00:35,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15495/15526 [4:46:55<00:34,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15495/15526 [4:46:55<00:34,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15496/15526 [4:46:55<00:33,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15496/15526 [4:46:55<00:33,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15497/15526 [4:46:57<00:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15497/15526 [4:46:57<00:32,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15498/15526 [4:46:58<00:31,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15498/15526 [4:46:58<00:31,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15499/15526 [4:46:59<00:29,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15499/15526 [4:46:59<00:29,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15500/15526 [4:47:00<00:28,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15500/15526 [4:47:00<00:28,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15501/15526 [4:47:01<00:27,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15501/15526 [4:47:01<00:27,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15502/15526 [4:47:02<00:26,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15502/15526 [4:47:02<00:26,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15503/15526 [4:47:02<00:25,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15503/15526 [4:47:02<00:25,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15504/15526 [4:47:04<00:24,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15504/15526 [4:47:04<00:24,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15505/15526 [4:47:04<00:23,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15505/15526 [4:47:04<00:23,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15506/15526 [4:47:05<00:22,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15506/15526 [4:47:05<00:22,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15507/15526 [4:47:06<00:21,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15507/15526 [4:47:06<00:21,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15508/15526 [4:47:07<00:19,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15508/15526 [4:47:07<00:19,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15509/15526 [4:47:09<00:18,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15509/15526 [4:47:09<00:18,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15510/15526 [4:47:09<00:17,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15510/15526 [4:47:09<00:17,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15511/15526 [4:47:10<00:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15511/15526 [4:47:10<00:16,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15512/15526 [4:47:11<00:15,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15512/15526 [4:47:11<00:15,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15513/15526 [4:47:12<00:14,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15513/15526 [4:47:12<00:14,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15514/15526 [4:47:13<00:13,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15514/15526 [4:47:13<00:13,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15515/15526 [4:47:14<00:12,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15515/15526 [4:47:14<00:12,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15516/15526 [4:47:14<00:11,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15516/15526 [4:47:14<00:11,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15517/15526 [4:47:16<00:09,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15517/15526 [4:47:16<00:09,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15518/15526 [4:47:17<00:08,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15518/15526 [4:47:17<00:08,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15519/15526 [4:47:18<00:07,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15519/15526 [4:47:18<00:07,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15520/15526 [4:47:24<00:06,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15520/15526 [4:47:24<00:06,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15521/15526 [4:47:25<00:05,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15521/15526 [4:47:25<00:05,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15522/15526 [4:47:26<00:04,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15522/15526 [4:47:26<00:04,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15523/15526 [4:47:27<00:03,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15523/15526 [4:47:27<00:03,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15524/15526 [4:47:27<00:02,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15524/15526 [4:47:27<00:02,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 15525/15526 [4:47:28<00:01,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|▉| 15525/15526 [4:47:28<00:01,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|█| 15526/15526 [4:47:29<00:00,  1.11s/it, v_num=73vx, train/loss=0\r",
-      "Epoch 0: 100%|█| 15526/15526 [4:47:29<00:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation: 0it [00:00, ?it/s]\u001b[A\r\n",
-      "\r",
-      "Validation:   0%|                                        | 0/16 [00:00<?, ?it/s]\u001b[A\r\n",
-      "\r",
-      "Validation DataLoader 0:   0%|                           | 0/16 [00:00<?, ?it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:   6%|█▏                 | 1/16 [00:00<00:07,  2.06it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  12%|██▍                | 2/16 [00:01<00:07,  1.80it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  19%|███▌               | 3/16 [00:01<00:06,  1.96it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  25%|████▊              | 4/16 [00:02<00:06,  1.90it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  31%|█████▉             | 5/16 [00:02<00:05,  1.97it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  38%|███████▏           | 6/16 [00:02<00:04,  2.03it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  44%|████████▎          | 7/16 [00:03<00:04,  2.07it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  50%|█████████▌         | 8/16 [00:03<00:03,  2.11it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  56%|██████████▋        | 9/16 [00:04<00:03,  2.14it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  62%|███████████▎      | 10/16 [00:04<00:02,  2.10it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  69%|████████████▍     | 11/16 [00:05<00:02,  2.07it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  75%|█████████████▌    | 12/16 [00:05<00:01,  2.05it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  81%|██████████████▋   | 13/16 [00:06<00:01,  2.07it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  88%|███████████████▊  | 14/16 [00:06<00:00,  2.05it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  94%|████████████████▉ | 15/16 [00:07<00:00,  2.07it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0: 100%|██████████████████| 16/16 [00:07<00:00,  2.09it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|█| 15526/15526 [4:47:38<00:00,  1.11s/it, v_num=73vx, train/loss=0\r\n",
-      "\r",
-      "                                                                                \u001b[A\r",
-      "Epoch 0: 100%|█| 15526/15526 [4:47:38<00:00,  1.11s/it, v_num=73vx, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "`Trainer.fit` stopped: `max_epochs=1` reached.\r\n",
-      "\r",
-      "Epoch 0: 100%|█| 15526/15526 [4:47:51<00:00,  1.11s/it, v_num=73vx, train/loss=0\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\u001b[34m\u001b[1mwandb\u001b[0m: Waiting for W&B process to finish... \u001b[32m(success).\u001b[0m\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\u001b[34m\u001b[1mwandb\u001b[0m: \r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: Run history:\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:              batchidx ▁▁▁▂▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▄▅▅▅▅▅▅▆▆▆▆▆▇▇▇▇▇▇███\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:                 epoch ▁▁▁▁▁▁▁▁▁▁\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:           global_rank ▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:          real_ctx_len ▇▄▄▁▁▁▇▆▄▃▂▂▄▇▆▃▃▅▅▃▂▄▅██▂▃▇▂▃▇▄▄▁▃▁▁█▄▇\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:               substep ▁▁▁▂▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▄▅▅▅▅▅▅▆▆▆▆▆▇▇▇▇▇▇███\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:            train/loss █▂▁▁▁▁▁▁▁▂▁▂▁▁▁▁▁▁▁▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:   trainer/global_step ▁▁▁▂▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▄▅▅▅▅▅▅▆▆▆▆▆▇▇▇▇▇▇███\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: trainer/learning_rate ███▇▇▇▇▇▇▆▆▆▆▆▅▅▅▅▅▅▄▄▄▄▄▄▃▃▃▃▃▂▂▂▂▂▂▁▁▁\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:       validation/loss ▁\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: \r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: Run summary:\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:              batchidx 15\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:                 epoch 0\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:           global_rank 0\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:          real_ctx_len 151\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:               substep 120\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:            train/loss 0.00043\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:   trainer/global_step 485\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: trainer/learning_rate 0.0002\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:       validation/loss 0.02165\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: \r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: 🚀 View run \u001b[33mv5-L96-D1024-E0.1 - Mem-Tune ctx-1k (train-ctx=1k, deepspeed_stage_1)\u001b[0m at: \u001b[34m\u001b[4mhttps://wandb.ai/rwkv-x-dev/RWKV-X-Experiments/runs/y5kr73vx\u001b[0m\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: ️⚡ View job at \u001b[34m\u001b[4mhttps://wandb.ai/rwkv-x-dev/RWKV-X-Experiments/jobs/QXJ0aWZhY3RDb2xsZWN0aW9uOjkzMjg5ODA3/version_details/v15\u001b[0m\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: Synced 5 W&B file(s), 0 media file(s), 2 artifact file(s) and 0 other file(s)\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: Find logs at: \u001b[35m\u001b[1m./wandb/run-20230831_215849-y5kr73vx/logs\u001b[0m\r\n"
-     ]
-    }
-   ],
-   "source": [
-    "# Start the finetune model training\n",
-    "!cd \"{TRAINER_DIR}\" && \\\n",
-    "    export WANDB_MODE=\"{WANDB_MODE}\" && \\\n",
-    "    export RWKV_WAVENET_LAYERS=\"{RWKV_WAVENET_LAYERS}\" && \\\n",
-    "    python lightning_trainer.py fit \\\n",
-    "        -c \"{NOTEBOOK_DIR}/config-mem-template.yaml\" \\\n",
-    "        --trainer.logger.init_args.name=\"{WANDB_PREFIX} - Mem-Tune ctx-1k (train-ctx=1k, {DEEPSPEED_STRAT})\" \\\n",
-    "        --trainer.strategy=\"{DEEPSPEED_STRAT}\" \\\n",
-    "        --trainer.devices=\"{GPU_DEVICES}\"  \\\n",
-    "        --trainer.callbacks.init_args.dirpath=\"../checkpoint/{FILENAME_PREFIX}-mem-ctx-1k/\" \\\n",
-    "        --model.lr_init=4e-4 \\\n",
-    "        --model.lr_final=2e-4 \\\n",
-    "        --data.max_token_size=1024 \\\n",
-    "        --model.ctx_len=1024 \\\n",
-    "        --model.bptt_learning_range=1 \\\n",
-    "        --model.load_model=\"../model/{FILENAME_PREFIX}-mem-ctx-512.pth\""
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 7,
-   "id": "03fce46e",
-   "metadata": {
-    "execution": {
-     "iopub.execute_input": "2023-09-01T02:53:35.702273Z",
-     "iopub.status.busy": "2023-09-01T02:53:35.701882Z",
-     "iopub.status.idle": "2023-09-01T02:53:51.260674Z",
-     "shell.execute_reply": "2023-09-01T02:53:51.259868Z"
-    },
-    "papermill": {
-     "duration": 16.559376,
-     "end_time": "2023-09-01T02:53:51.262527",
-     "exception": false,
-     "start_time": "2023-09-01T02:53:34.703151",
-     "status": "completed"
-    },
-    "tags": []
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Setting ds_accelerator to cuda (auto detect)\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Processing zero checkpoint '../checkpoint/v5-L96-D1024-E0_1-mem-ctx-1k/last.ckpt/checkpoint'\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Detected checkpoint of type zero stage ZeroStageEnum.optimizer_states, world_size: 8\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Parsing checkpoint created by deepspeed==0.9.3\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Reconstructed fp32 state dict with 1926 params 1412678656 elements\r\n",
-      "Saving bf16 state dict to ../model/v5-L96-D1024-E0_1-mem-ctx-1k.pth\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r-- 1 root root 2.7G Sep  1 02:53 ../model/v5-L96-D1024-E0_1-mem-ctx-1k.pth\r\n"
-     ]
-    }
-   ],
-   "source": [
-    "# Lets export the model from the checkpoint\n",
-    "!cd \"{TRAINER_DIR}\" && \\\n",
-    "    python export_checkpoint.py \\\n",
-    "        \"../checkpoint/{FILENAME_PREFIX}-mem-ctx-1k/last.ckpt\" \\\n",
-    "        \"../model/{FILENAME_PREFIX}-mem-ctx-1k.pth\" \"bf16\"\n",
-    "!cd \"{TRAINER_DIR}\" && ls -alh \"../model/{FILENAME_PREFIX}-mem-ctx-1k.pth\""
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 8,
-   "id": "3cc5f6d0",
-   "metadata": {
-    "execution": {
-     "iopub.execute_input": "2023-09-01T02:53:53.227111Z",
-     "iopub.status.busy": "2023-09-01T02:53:53.226836Z",
-     "iopub.status.idle": "2023-09-01T02:55:35.197469Z",
-     "shell.execute_reply": "2023-09-01T02:55:35.196671Z"
-    },
-    "papermill": {
-     "duration": 103.027473,
-     "end_time": "2023-09-01T02:55:35.199951",
-     "exception": false,
-     "start_time": "2023-09-01T02:53:52.172478",
-     "status": "completed"
-    },
-    "tags": []
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Setting ds_accelerator to cuda (auto detect)\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[RWKV.model] Running RWKV model using 'torch-jit' with torch '2.0.1+cu118'\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "###\r\n",
-      "### Model validation start ###\r\n",
-      "###\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 5 tokens : 100.0% similarity, with 5 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 10 tokens : 100.0% similarity, with 10 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 15 tokens : 100.0% similarity, with 15 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 20 tokens : 100.0% similarity, with 20 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 25 tokens : 100.0% similarity, with 25 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 30 tokens : 100.0% similarity, with 30 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 35 tokens : 100.0% similarity, with 35 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 40 tokens : 100.0% similarity, with 40 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 45 tokens : 100.0% similarity, with 45 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 50 tokens : 100.0% similarity, with 50 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 55 tokens : 100.0% similarity, with 55 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 60 tokens : 100.0% similarity, with 60 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 65 tokens : 100.0% similarity, with 65 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 70 tokens : 100.0% similarity, with 70 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 75 tokens : 100.0% similarity, with 75 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 80 tokens : 100.0% similarity, with 80 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 85 tokens : 100.0% similarity, with 85 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 90 tokens : 100.0% similarity, with 90 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 95 tokens : 100.0% similarity, with 95 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 100 tokens : 100.0% similarity, with 100 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 105 tokens : 100.0% similarity, with 105 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 110 tokens : 100.0% similarity, with 110 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 115 tokens : 100.0% similarity, with 115 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 120 tokens : 100.0% similarity, with 120 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 125 tokens : 100.0% similarity, with 125 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 130 tokens : 100.0% similarity, with 130 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 135 tokens : 100.0% similarity, with 135 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 140 tokens : 100.0% similarity, with 140 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 145 tokens : 100.0% similarity, with 145 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 150 tokens : 100.0% similarity, with 150 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 160 tokens : 100.0% similarity, with 160 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 170 tokens : 100.0% similarity, with 170 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 180 tokens : 100.0% similarity, with 180 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 190 tokens : 100.0% similarity, with 190 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 200 tokens : 100.0% similarity, with 200 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 210 tokens : 100.0% similarity, with 210 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 220 tokens : 100.0% similarity, with 220 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 230 tokens : 100.0% similarity, with 230 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 240 tokens : 100.0% similarity, with 240 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 250 tokens : 100.0% similarity, with 250 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 260 tokens : 100.0% similarity, with 260 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 270 tokens : 100.0% similarity, with 270 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 280 tokens : 100.0% similarity, with 280 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 290 tokens : 100.0% similarity, with 290 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 300 tokens : 99.33333333333333% similarity, with 298 matched token, and 2 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 325 tokens : 99.38461538461539% similarity, with 323 matched token, and 2 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 350 tokens : 98.85714285714286% similarity, with 346 matched token, and 4 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 375 tokens : 97.86666666666667% similarity, with 367 matched token, and 8 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 400 tokens : 97.0% similarity, with 388 matched token, and 12 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 425 tokens : 95.29411764705881% similarity, with 405 matched token, and 20 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 450 tokens : 92.88888888888889% similarity, with 418 matched token, and 32 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 475 tokens : 90.31578947368422% similarity, with 429 matched token, and 46 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 500 tokens : 88.0% similarity, with 440 matched token, and 60 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 525 tokens : 83.80952380952381% similarity, with 440 matched token, and 85 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 550 tokens : 81.81818181818183% similarity, with 450 matched token, and 100 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 575 tokens : 78.95652173913044% similarity, with 454 matched token, and 121 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 600 tokens : 75.16666666666667% similarity, with 451 matched token, and 149 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 625 tokens : 71.36% similarity, with 446 matched token, and 179 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 650 tokens : 66.15384615384615% similarity, with 430 matched token, and 220 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 675 tokens : 62.66666666666667% similarity, with 423 matched token, and 252 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 700 tokens : 56.99999999999999% similarity, with 399 matched token, and 301 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 750 tokens : 50.13333333333333% similarity, with 376 matched token, and 374 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 800 tokens : 43.125% similarity, with 345 matched token, and 455 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 850 tokens : 36.0% similarity, with 306 matched token, and 544 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 900 tokens : 30.666666666666664% similarity, with 276 matched token, and 624 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 950 tokens : 24.947368421052634% similarity, with 237 matched token, and 713 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 1000 tokens : 22.6% similarity, with 226 matched token, and 774 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "###\r\n",
-      "### Model validation end ###\r\n",
-      "###\r\n"
-     ]
-    }
-   ],
-   "source": [
-    "# Lets do a quick memory test\n",
-    "!export RWKV_WAVENET_LAYERS=\"{RWKV_WAVENET_LAYERS}\" && \\\n",
-    "        python3 ../memory_script/eval_v5_memory_guided.py \"{PROJECT_DIR}/model/{FILENAME_PREFIX}-mem-ctx-1k.pth\""
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "id": "254f8c4a",
-   "metadata": {
-    "papermill": {
-     "duration": 0.892352,
-     "end_time": "2023-09-01T02:55:36.976773",
-     "exception": false,
-     "start_time": "2023-09-01T02:55:36.084421",
-     "status": "completed"
-    },
-    "tags": []
-   },
-   "source": [
-    "## Tune 4 : Low ctx size (2048), memory training\n",
-    "\n",
-    "- Tune 4: Low ctx size (2048), Scaling up !"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 9,
-   "id": "ff5d5744",
-   "metadata": {
-    "execution": {
-     "iopub.execute_input": "2023-09-01T02:55:38.866730Z",
-     "iopub.status.busy": "2023-09-01T02:55:38.866382Z",
-     "iopub.status.idle": "2023-09-01T02:55:40.572661Z",
-     "shell.execute_reply": "2023-09-01T02:55:40.571225Z"
-    },
-    "papermill": {
-     "duration": 2.708693,
-     "end_time": "2023-09-01T02:55:40.680134",
-     "exception": false,
-     "start_time": "2023-09-01T02:55:37.971441",
-     "status": "completed"
-    },
-    "tags": []
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Generating word reptition dataset ##\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 2 max words, 100 samples - at ../dataset/word-2-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 129 samples (1 token repeat) - 20 max words - at ../dataset/shuffle-word-20-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 20 max words, 100 samples - at ../dataset/gen-word-20-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 30 samples (1 token repeat) - 85 max words - at ../dataset/shuffle-word-85-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 5 max words, 100 samples - at ../dataset/gen-word-5-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 560 samples (1 token repeat) - 5 max words - at ../dataset/shuffle-word-5-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 59 samples (1 token repeat) - 45 max words - at ../dataset/shuffle-word-45-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 50 max words, 100 samples - at ../dataset/gen-word-50-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 55 max words, 100 samples - at ../dataset/gen-word-55-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 44 samples (1 token repeat) - 60 max words - at ../dataset/shuffle-word-60-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 75 max words, 100 samples - at ../dataset/gen-word-75-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 37 samples (1 token repeat) - 75 max words - at ../dataset/shuffle-word-75-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 69 samples (1 token repeat) - 40 max words - at ../dataset/shuffle-word-40-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 25 max words, 100 samples - at ../dataset/gen-word-25-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 10 max words, 100 samples - at ../dataset/gen-word-10-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 30 max words, 100 samples - at ../dataset/gen-word-30-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 35 max words, 100 samples - at ../dataset/gen-word-35-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 15 max words, 100 samples - at ../dataset/gen-word-15-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 52 samples (1 token repeat) - 50 max words - at ../dataset/shuffle-word-50-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 47 samples (1 token repeat) - 55 max words - at ../dataset/shuffle-word-55-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 40 max words, 100 samples - at ../dataset/gen-word-40-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 259 samples (1 token repeat) - 10 max words - at ../dataset/shuffle-word-10-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 90 max words, 100 samples - at ../dataset/gen-word-90-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 28 samples (1 token repeat) - 90 max words - at ../dataset/shuffle-word-90-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 39 samples (1 token repeat) - 70 max words - at ../dataset/shuffle-word-70-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 60 max words, 100 samples - at ../dataset/gen-word-60-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 65 max words, 100 samples - at ../dataset/gen-word-65-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 70 max words, 100 samples - at ../dataset/gen-word-70-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 43 samples (1 token repeat) - 65 max words - at ../dataset/shuffle-word-65-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 178 samples (1 token repeat) - 15 max words - at ../dataset/shuffle-word-15-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 110 samples (1 token repeat) - 25 max words - at ../dataset/shuffle-word-25-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 75 samples (1 token repeat) - 35 max words - at ../dataset/shuffle-word-35-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 86 samples (1 token repeat) - 30 max words - at ../dataset/shuffle-word-30-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 28 samples (1 token repeat) - 100 max words - at ../dataset/shuffle-word-100-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 45 max words, 100 samples - at ../dataset/gen-word-45-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 110 max words, 200 samples - at ../dataset/gen-word-110-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 80 max words, 100 samples - at ../dataset/gen-word-80-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 115 max words, 200 samples - at ../dataset/gen-word-115-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 100 max words, 100 samples - at ../dataset/gen-word-100-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 33 samples (1 token repeat) - 80 max words - at ../dataset/shuffle-word-80-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 120 max words, 200 samples - at ../dataset/gen-word-120-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 367 samples (20 token repeat) - 120 max words - at ../dataset/shuffle-word-120-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 346 samples (20 token repeat) - 130 max words - at ../dataset/shuffle-word-130-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 198 samples (20 token repeat) - 235 max words - at ../dataset/shuffle-word-235-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 142 samples (20 token repeat) - 360 max words - at ../dataset/shuffle-word-360-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 99 samples (20 token repeat) - 595 max words - at ../dataset/shuffle-word-595-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 155 max words, 200 samples - at ../dataset/gen-word-155-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 218 samples (20 token repeat) - 205 max words - at ../dataset/shuffle-word-205-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 160 max words, 200 samples - at ../dataset/gen-word-160-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 184 samples (20 token repeat) - 300 max words - at ../dataset/shuffle-word-300-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 920 max words - at ../dataset/shuffle-word-920-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 140 samples (20 token repeat) - 370 max words - at ../dataset/shuffle-word-370-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 140 samples (20 token repeat) - 340 max words - at ../dataset/shuffle-word-340-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 435 max words, 200 samples - at ../dataset/gen-word-435-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 340 max words, 200 samples - at ../dataset/gen-word-340-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 120 samples (20 token repeat) - 405 max words - at ../dataset/shuffle-word-405-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 411 samples (20 token repeat) - 105 max words - at ../dataset/shuffle-word-105-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 320 max words, 200 samples - at ../dataset/gen-word-320-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 390 max words, 200 samples - at ../dataset/gen-word-390-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 400 max words, 200 samples - at ../dataset/gen-word-400-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 260 max words, 200 samples - at ../dataset/gen-word-260-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 193 samples (20 token repeat) - 240 max words - at ../dataset/shuffle-word-240-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 208 samples (20 token repeat) - 210 max words - at ../dataset/shuffle-word-210-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 165 max words, 200 samples - at ../dataset/gen-word-165-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 130 max words, 200 samples - at ../dataset/gen-word-130-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 990 max words - at ../dataset/shuffle-word-990-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 960 max words - at ../dataset/shuffle-word-960-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 288 samples (20 token repeat) - 165 max words - at ../dataset/shuffle-word-165-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 170 max words, 200 samples - at ../dataset/gen-word-170-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1075 max words - at ../dataset/shuffle-word-1075-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1030 max words - at ../dataset/shuffle-word-1030-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 570 max words, 200 samples - at ../dataset/gen-word-570-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 141 samples (20 token repeat) - 330 max words - at ../dataset/shuffle-word-330-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 140 max words, 200 samples - at ../dataset/gen-word-140-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1035 max words - at ../dataset/shuffle-word-1035-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 840 max words, 200 samples - at ../dataset/gen-word-840-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 235 max words, 200 samples - at ../dataset/gen-word-235-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 141 samples (20 token repeat) - 375 max words - at ../dataset/shuffle-word-375-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 59 samples (20 token repeat) - 1180 max words - at ../dataset/shuffle-word-1180-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 291 samples (20 token repeat) - 160 max words - at ../dataset/shuffle-word-160-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 200 max words, 200 samples - at ../dataset/gen-word-200-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 182 samples (20 token repeat) - 260 max words - at ../dataset/shuffle-word-260-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 915 max words - at ../dataset/shuffle-word-915-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 140 samples (20 token repeat) - 345 max words - at ../dataset/shuffle-word-345-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 895 max words, 200 samples - at ../dataset/gen-word-895-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 150 max words, 200 samples - at ../dataset/gen-word-150-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 187 samples (20 token repeat) - 290 max words - at ../dataset/shuffle-word-290-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1045 max words - at ../dataset/shuffle-word-1045-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 29 samples (1 token repeat) - 95 max words - at ../dataset/shuffle-word-95-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 355 max words, 200 samples - at ../dataset/gen-word-355-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 189 samples (20 token repeat) - 255 max words - at ../dataset/shuffle-word-255-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 46 samples (20 token repeat) - 1280 max words - at ../dataset/shuffle-word-1280-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 183 samples (20 token repeat) - 285 max words - at ../dataset/shuffle-word-285-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 195 max words, 200 samples - at ../dataset/gen-word-195-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 283 samples (20 token repeat) - 170 max words - at ../dataset/shuffle-word-170-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 62 samples (20 token repeat) - 820 max words - at ../dataset/shuffle-word-820-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 277 samples (20 token repeat) - 180 max words - at ../dataset/shuffle-word-180-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 225 max words, 200 samples - at ../dataset/gen-word-225-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 740 max words, 200 samples - at ../dataset/gen-word-740-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 230 max words, 200 samples - at ../dataset/gen-word-230-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1080 max words - at ../dataset/shuffle-word-1080-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 141 samples (20 token repeat) - 315 max words - at ../dataset/shuffle-word-315-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 375 max words, 200 samples - at ../dataset/gen-word-375-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 306 samples (20 token repeat) - 150 max words - at ../dataset/shuffle-word-150-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 62 samples (20 token repeat) - 890 max words - at ../dataset/shuffle-word-890-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 396 samples (20 token repeat) - 110 max words - at ../dataset/shuffle-word-110-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 117 samples (20 token repeat) - 465 max words - at ../dataset/shuffle-word-465-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 145 max words, 200 samples - at ../dataset/gen-word-145-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 925 max words - at ../dataset/shuffle-word-925-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 940 max words - at ../dataset/shuffle-word-940-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 95 max words, 100 samples - at ../dataset/gen-word-95-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 315 max words, 200 samples - at ../dataset/gen-word-315-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 305 max words, 200 samples - at ../dataset/gen-word-305-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1020 max words - at ../dataset/shuffle-word-1020-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 141 samples (20 token repeat) - 320 max words - at ../dataset/shuffle-word-320-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1340 max words - at ../dataset/shuffle-word-1340-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 46 samples (20 token repeat) - 1205 max words - at ../dataset/shuffle-word-1205-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 550 max words - at ../dataset/shuffle-word-550-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 146 samples (20 token repeat) - 305 max words - at ../dataset/shuffle-word-305-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 302 samples (20 token repeat) - 155 max words - at ../dataset/shuffle-word-155-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 965 max words - at ../dataset/shuffle-word-965-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 64 samples (20 token repeat) - 825 max words - at ../dataset/shuffle-word-825-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 118 samples (20 token repeat) - 500 max words - at ../dataset/shuffle-word-500-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1530 max words - at ../dataset/shuffle-word-1530-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 41 samples (20 token repeat) - 1365 max words - at ../dataset/shuffle-word-1365-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 85 max words, 100 samples - at ../dataset/gen-word-85-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 525 max words - at ../dataset/shuffle-word-525-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1025 max words - at ../dataset/shuffle-word-1025-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 455 max words, 200 samples - at ../dataset/gen-word-455-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 273 samples (20 token repeat) - 185 max words - at ../dataset/shuffle-word-185-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1640 max words - at ../dataset/shuffle-word-1640-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1010 max words - at ../dataset/shuffle-word-1010-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 215 max words, 200 samples - at ../dataset/gen-word-215-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 183 samples (20 token repeat) - 280 max words - at ../dataset/shuffle-word-280-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 140 samples (20 token repeat) - 355 max words - at ../dataset/shuffle-word-355-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 545 max words - at ../dataset/shuffle-word-545-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 141 samples (20 token repeat) - 335 max words - at ../dataset/shuffle-word-335-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 67 samples (20 token repeat) - 895 max words - at ../dataset/shuffle-word-895-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1945 max words - at ../dataset/shuffle-word-1945-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 240 max words, 200 samples - at ../dataset/gen-word-240-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 270 max words, 200 samples - at ../dataset/gen-word-270-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1310 max words - at ../dataset/shuffle-word-1310-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1120 max words - at ../dataset/shuffle-word-1120-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 99 samples (20 token repeat) - 540 max words - at ../dataset/shuffle-word-540-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1390 max words - at ../dataset/shuffle-word-1390-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1165 max words - at ../dataset/shuffle-word-1165-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1460 max words - at ../dataset/shuffle-word-1460-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1040 max words - at ../dataset/shuffle-word-1040-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 116 samples (20 token repeat) - 455 max words - at ../dataset/shuffle-word-455-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1150 max words - at ../dataset/shuffle-word-1150-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1625 max words - at ../dataset/shuffle-word-1625-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 269 samples (20 token repeat) - 195 max words - at ../dataset/shuffle-word-195-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 199 samples (20 token repeat) - 230 max words - at ../dataset/shuffle-word-230-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 345 max words, 200 samples - at ../dataset/gen-word-345-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 295 max words, 200 samples - at ../dataset/gen-word-295-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 141 samples (20 token repeat) - 385 max words - at ../dataset/shuffle-word-385-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 356 samples (20 token repeat) - 125 max words - at ../dataset/shuffle-word-125-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 65 samples (20 token repeat) - 835 max words - at ../dataset/shuffle-word-835-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 280 max words, 200 samples - at ../dataset/gen-word-280-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1490 max words - at ../dataset/shuffle-word-1490-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 141 samples (20 token repeat) - 310 max words - at ../dataset/shuffle-word-310-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1135 max words - at ../dataset/shuffle-word-1135-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 870 max words, 200 samples - at ../dataset/gen-word-870-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 62 samples (20 token repeat) - 845 max words - at ../dataset/shuffle-word-845-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 210 max words, 200 samples - at ../dataset/gen-word-210-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 81 samples (20 token repeat) - 690 max words - at ../dataset/shuffle-word-690-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 950 max words - at ../dataset/shuffle-word-950-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 905 max words, 200 samples - at ../dataset/gen-word-905-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 140 samples (20 token repeat) - 380 max words - at ../dataset/shuffle-word-380-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 985 max words - at ../dataset/shuffle-word-985-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 905 max words - at ../dataset/shuffle-word-905-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 81 samples (20 token repeat) - 615 max words - at ../dataset/shuffle-word-615-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 185 max words, 200 samples - at ../dataset/gen-word-185-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1455 max words - at ../dataset/shuffle-word-1455-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 79 samples (20 token repeat) - 705 max words - at ../dataset/shuffle-word-705-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 175 max words, 200 samples - at ../dataset/gen-word-175-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 945 max words - at ../dataset/shuffle-word-945-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 955 max words - at ../dataset/shuffle-word-955-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 42 samples (20 token repeat) - 1320 max words - at ../dataset/shuffle-word-1320-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 960 max words, 200 samples - at ../dataset/gen-word-960-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 220 max words, 200 samples - at ../dataset/gen-word-220-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 185 samples (20 token repeat) - 275 max words - at ../dataset/shuffle-word-275-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 350 max words, 200 samples - at ../dataset/gen-word-350-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1970 max words - at ../dataset/shuffle-word-1970-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 300 max words, 200 samples - at ../dataset/gen-word-300-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 910 max words - at ../dataset/shuffle-word-910-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1955 max words - at ../dataset/shuffle-word-1955-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1920 max words - at ../dataset/shuffle-word-1920-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1015 max words - at ../dataset/shuffle-word-1015-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 117 samples (20 token repeat) - 480 max words - at ../dataset/shuffle-word-480-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1055 max words - at ../dataset/shuffle-word-1055-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1715 max words - at ../dataset/shuffle-word-1715-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1875 max words - at ../dataset/shuffle-word-1875-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 265 max words, 200 samples - at ../dataset/gen-word-265-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 665 max words - at ../dataset/shuffle-word-665-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1765 max words - at ../dataset/shuffle-word-1765-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1560 max words - at ../dataset/shuffle-word-1560-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1565 max words - at ../dataset/shuffle-word-1565-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1500 max words - at ../dataset/shuffle-word-1500-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1710 max words - at ../dataset/shuffle-word-1710-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 274 samples (20 token repeat) - 175 max words - at ../dataset/shuffle-word-175-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 41 samples (20 token repeat) - 1335 max words - at ../dataset/shuffle-word-1335-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1485 max words - at ../dataset/shuffle-word-1485-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1450 max words - at ../dataset/shuffle-word-1450-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 680 max words, 200 samples - at ../dataset/gen-word-680-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1445 max words - at ../dataset/shuffle-word-1445-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 975 max words - at ../dataset/shuffle-word-975-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 116 samples (20 token repeat) - 475 max words - at ../dataset/shuffle-word-475-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1605 max words - at ../dataset/shuffle-word-1605-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 51 samples (20 token repeat) - 1210 max words - at ../dataset/shuffle-word-1210-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 670 max words - at ../dataset/shuffle-word-670-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1895 max words - at ../dataset/shuffle-word-1895-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 82 samples (20 token repeat) - 605 max words - at ../dataset/shuffle-word-605-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 450 max words, 200 samples - at ../dataset/gen-word-450-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 183 samples (20 token repeat) - 270 max words - at ../dataset/shuffle-word-270-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1930 max words - at ../dataset/shuffle-word-1930-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1665 max words - at ../dataset/shuffle-word-1665-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 51 samples (20 token repeat) - 1215 max words - at ../dataset/shuffle-word-1215-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1515 max words - at ../dataset/shuffle-word-1515-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 515 max words - at ../dataset/shuffle-word-515-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 117 samples (20 token repeat) - 440 max words - at ../dataset/shuffle-word-440-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 46 samples (20 token repeat) - 1265 max words - at ../dataset/shuffle-word-1265-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1175 max words - at ../dataset/shuffle-word-1175-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1535 max words - at ../dataset/shuffle-word-1535-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 141 samples (20 token repeat) - 325 max words - at ../dataset/shuffle-word-325-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1345 max words - at ../dataset/shuffle-word-1345-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1910 max words - at ../dataset/shuffle-word-1910-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 381 samples (20 token repeat) - 115 max words - at ../dataset/shuffle-word-115-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1650 max words, 200 samples - at ../dataset/gen-word-1650-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 480 max words, 200 samples - at ../dataset/gen-word-480-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 620 max words - at ../dataset/shuffle-word-620-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1125 max words - at ../dataset/shuffle-word-1125-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 445 max words, 200 samples - at ../dataset/gen-word-445-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 850 max words, 200 samples - at ../dataset/gen-word-850-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 530 max words, 200 samples - at ../dataset/gen-word-530-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 276 samples (20 token repeat) - 190 max words - at ../dataset/shuffle-word-190-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1525 max words - at ../dataset/shuffle-word-1525-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 180 max words, 200 samples - at ../dataset/gen-word-180-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 545 max words, 200 samples - at ../dataset/gen-word-545-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 245 max words, 200 samples - at ../dataset/gen-word-245-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1110 max words, 200 samples - at ../dataset/gen-word-1110-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1855 max words - at ../dataset/shuffle-word-1855-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1630 max words - at ../dataset/shuffle-word-1630-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1830 max words - at ../dataset/shuffle-word-1830-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 51 samples (20 token repeat) - 1275 max words - at ../dataset/shuffle-word-1275-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1680 max words - at ../dataset/shuffle-word-1680-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 360 max words, 200 samples - at ../dataset/gen-word-360-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 440 max words, 200 samples - at ../dataset/gen-word-440-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1320 max words, 200 samples - at ../dataset/gen-word-1320-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1050 max words - at ../dataset/shuffle-word-1050-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 730 max words - at ../dataset/shuffle-word-730-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 740 max words - at ../dataset/shuffle-word-740-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1100 max words - at ../dataset/shuffle-word-1100-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 275 max words, 200 samples - at ../dataset/gen-word-275-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 52 samples (20 token repeat) - 1245 max words - at ../dataset/shuffle-word-1245-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 590 max words - at ../dataset/shuffle-word-590-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1890 max words - at ../dataset/shuffle-word-1890-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1660 max words - at ../dataset/shuffle-word-1660-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 580 max words, 200 samples - at ../dataset/gen-word-580-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1470 max words - at ../dataset/shuffle-word-1470-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1655 max words - at ../dataset/shuffle-word-1655-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1725 max words - at ../dataset/shuffle-word-1725-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1940 max words - at ../dataset/shuffle-word-1940-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 81 samples (20 token repeat) - 660 max words - at ../dataset/shuffle-word-660-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 255 max words, 200 samples - at ../dataset/gen-word-255-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 930 max words - at ../dataset/shuffle-word-930-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 201 samples (20 token repeat) - 220 max words - at ../dataset/shuffle-word-220-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1720 max words - at ../dataset/shuffle-word-1720-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 635 max words - at ../dataset/shuffle-word-635-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1480 max words - at ../dataset/shuffle-word-1480-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 105 max words, 200 samples - at ../dataset/gen-word-105-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1840 max words - at ../dataset/shuffle-word-1840-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 184 samples (20 token repeat) - 295 max words - at ../dataset/shuffle-word-295-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 205 max words, 200 samples - at ../dataset/gen-word-205-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1070 max words, 200 samples - at ../dataset/gen-word-1070-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 337 samples (20 token repeat) - 135 max words - at ../dataset/shuffle-word-135-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1220 max words, 200 samples - at ../dataset/gen-word-1220-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 141 samples (20 token repeat) - 395 max words - at ../dataset/shuffle-word-395-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 63 samples (20 token repeat) - 840 max words - at ../dataset/shuffle-word-840-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1615 max words - at ../dataset/shuffle-word-1615-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 330 max words, 200 samples - at ../dataset/gen-word-330-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 41 samples (20 token repeat) - 1380 max words - at ../dataset/shuffle-word-1380-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 580 max words - at ../dataset/shuffle-word-580-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 79 samples (20 token repeat) - 755 max words - at ../dataset/shuffle-word-755-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 325 max words, 200 samples - at ../dataset/gen-word-325-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 117 samples (20 token repeat) - 450 max words - at ../dataset/shuffle-word-450-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1675 max words - at ../dataset/shuffle-word-1675-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 63 samples (20 token repeat) - 830 max words - at ../dataset/shuffle-word-830-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1170 max words - at ../dataset/shuffle-word-1170-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1420 max words - at ../dataset/shuffle-word-1420-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1410 max words - at ../dataset/shuffle-word-1410-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 41 samples (20 token repeat) - 1305 max words - at ../dataset/shuffle-word-1305-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1435 max words - at ../dataset/shuffle-word-1435-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 715 max words, 200 samples - at ../dataset/gen-word-715-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 140 samples (20 token repeat) - 400 max words - at ../dataset/shuffle-word-400-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 995 max words, 200 samples - at ../dataset/gen-word-995-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 605 max words, 200 samples - at ../dataset/gen-word-605-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1590 max words - at ../dataset/shuffle-word-1590-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1915 max words - at ../dataset/shuffle-word-1915-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 760 max words - at ../dataset/shuffle-word-760-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 970 max words - at ../dataset/shuffle-word-970-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 48 samples (20 token repeat) - 1255 max words - at ../dataset/shuffle-word-1255-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1135 max words, 200 samples - at ../dataset/gen-word-1135-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 59 samples (20 token repeat) - 1160 max words - at ../dataset/shuffle-word-1160-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 655 max words, 200 samples - at ../dataset/gen-word-655-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 50 samples (20 token repeat) - 1250 max words - at ../dataset/shuffle-word-1250-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 119 samples (20 token repeat) - 495 max words - at ../dataset/shuffle-word-495-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1585 max words - at ../dataset/shuffle-word-1585-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 65 samples (20 token repeat) - 870 max words - at ../dataset/shuffle-word-870-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 49 samples (20 token repeat) - 1225 max words - at ../dataset/shuffle-word-1225-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1400 max words - at ../dataset/shuffle-word-1400-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 630 max words - at ../dataset/shuffle-word-630-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 600 max words - at ../dataset/shuffle-word-600-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 645 max words, 200 samples - at ../dataset/gen-word-645-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 925 max words, 200 samples - at ../dataset/gen-word-925-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1470 max words, 200 samples - at ../dataset/gen-word-1470-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 720 max words - at ../dataset/shuffle-word-720-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 410 max words, 200 samples - at ../dataset/gen-word-410-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 59 samples (20 token repeat) - 1105 max words - at ../dataset/shuffle-word-1105-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1465 max words - at ../dataset/shuffle-word-1465-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 335 max words, 200 samples - at ../dataset/gen-word-335-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 59 samples (20 token repeat) - 1110 max words - at ../dataset/shuffle-word-1110-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1140 max words - at ../dataset/shuffle-word-1140-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 980 max words - at ../dataset/shuffle-word-980-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1600 max words - at ../dataset/shuffle-word-1600-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 118 samples (20 token repeat) - 490 max words - at ../dataset/shuffle-word-490-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 64 samples (20 token repeat) - 855 max words - at ../dataset/shuffle-word-855-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 81 samples (20 token repeat) - 685 max words - at ../dataset/shuffle-word-685-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 79 samples (20 token repeat) - 780 max words - at ../dataset/shuffle-word-780-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1155 max words - at ../dataset/shuffle-word-1155-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 380 max words, 200 samples - at ../dataset/gen-word-380-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 900 max words, 200 samples - at ../dataset/gen-word-900-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 41 samples (20 token repeat) - 1375 max words - at ../dataset/shuffle-word-1375-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1015 max words, 200 samples - at ../dataset/gen-word-1015-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1440 max words - at ../dataset/shuffle-word-1440-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1905 max words - at ../dataset/shuffle-word-1905-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 82 samples (20 token repeat) - 680 max words - at ../dataset/shuffle-word-680-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 910 max words, 200 samples - at ../dataset/gen-word-910-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1395 max words - at ../dataset/shuffle-word-1395-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1185 max words - at ../dataset/shuffle-word-1185-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1350 max words - at ../dataset/shuffle-word-1350-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 81 samples (20 token repeat) - 625 max words - at ../dataset/shuffle-word-625-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1115 max words, 200 samples - at ../dataset/gen-word-1115-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 490 max words, 200 samples - at ../dataset/gen-word-490-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1865 max words - at ../dataset/shuffle-word-1865-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1360 max words, 200 samples - at ../dataset/gen-word-1360-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 610 max words, 200 samples - at ../dataset/gen-word-610-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1385 max words - at ../dataset/shuffle-word-1385-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 53 samples (20 token repeat) - 1230 max words - at ../dataset/shuffle-word-1230-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1000 max words - at ../dataset/shuffle-word-1000-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 995 max words - at ../dataset/shuffle-word-995-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 272 samples (20 token repeat) - 200 max words - at ../dataset/shuffle-word-200-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1430 max words - at ../dataset/shuffle-word-1430-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1740 max words - at ../dataset/shuffle-word-1740-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 950 max words, 200 samples - at ../dataset/gen-word-950-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 725 max words - at ../dataset/shuffle-word-725-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 620 max words, 200 samples - at ../dataset/gen-word-620-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 42 samples (20 token repeat) - 1355 max words - at ../dataset/shuffle-word-1355-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 365 max words, 200 samples - at ../dataset/gen-word-365-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1695 max words - at ../dataset/shuffle-word-1695-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 935 max words - at ../dataset/shuffle-word-935-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 395 max words, 200 samples - at ../dataset/gen-word-395-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 785 max words, 200 samples - at ../dataset/gen-word-785-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1975 max words, 200 samples - at ../dataset/gen-word-1975-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 385 max words, 200 samples - at ../dataset/gen-word-385-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1045 max words, 200 samples - at ../dataset/gen-word-1045-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1115 max words - at ../dataset/shuffle-word-1115-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1040 max words, 200 samples - at ../dataset/gen-word-1040-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 990 max words, 200 samples - at ../dataset/gen-word-990-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 595 max words, 200 samples - at ../dataset/gen-word-595-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 955 max words, 200 samples - at ../dataset/gen-word-955-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1195 max words, 200 samples - at ../dataset/gen-word-1195-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 700 max words, 200 samples - at ../dataset/gen-word-700-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1105 max words, 200 samples - at ../dataset/gen-word-1105-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 117 samples (20 token repeat) - 445 max words - at ../dataset/shuffle-word-445-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 290 max words, 200 samples - at ../dataset/gen-word-290-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 575 max words, 200 samples - at ../dataset/gen-word-575-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1770 max words - at ../dataset/shuffle-word-1770-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 525 max words, 200 samples - at ../dataset/gen-word-525-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1530 max words, 200 samples - at ../dataset/gen-word-1530-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 690 max words, 200 samples - at ../dataset/gen-word-690-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1860 max words, 200 samples - at ../dataset/gen-word-1860-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 505 max words, 200 samples - at ../dataset/gen-word-505-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1195 max words - at ../dataset/shuffle-word-1195-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 46 samples (20 token repeat) - 1290 max words - at ../dataset/shuffle-word-1290-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1610 max words - at ../dataset/shuffle-word-1610-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1005 max words, 200 samples - at ../dataset/gen-word-1005-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1025 max words, 200 samples - at ../dataset/gen-word-1025-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1080 max words, 200 samples - at ../dataset/gen-word-1080-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1140 max words, 200 samples - at ../dataset/gen-word-1140-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1685 max words, 200 samples - at ../dataset/gen-word-1685-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1360 max words - at ../dataset/shuffle-word-1360-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 325 samples (20 token repeat) - 140 max words - at ../dataset/shuffle-word-140-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 565 max words - at ../dataset/shuffle-word-565-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1480 max words, 200 samples - at ../dataset/gen-word-1480-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1065 max words, 200 samples - at ../dataset/gen-word-1065-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1095 max words, 200 samples - at ../dataset/gen-word-1095-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1885 max words - at ../dataset/shuffle-word-1885-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1085 max words, 200 samples - at ../dataset/gen-word-1085-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 520 max words - at ../dataset/shuffle-word-520-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 415 max words, 200 samples - at ../dataset/gen-word-415-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1620 max words - at ../dataset/shuffle-word-1620-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1545 max words - at ../dataset/shuffle-word-1545-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 930 max words, 200 samples - at ../dataset/gen-word-930-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1455 max words, 200 samples - at ../dataset/gen-word-1455-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 555 max words - at ../dataset/shuffle-word-555-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1130 max words, 200 samples - at ../dataset/gen-word-1130-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 495 max words, 200 samples - at ../dataset/gen-word-495-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 118 samples (20 token repeat) - 470 max words - at ../dataset/shuffle-word-470-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1510 max words - at ../dataset/shuffle-word-1510-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 119 samples (20 token repeat) - 435 max words - at ../dataset/shuffle-word-435-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 116 samples (20 token repeat) - 430 max words - at ../dataset/shuffle-word-430-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1780 max words - at ../dataset/shuffle-word-1780-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 79 samples (20 token repeat) - 770 max words - at ../dataset/shuffle-word-770-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 920 max words, 200 samples - at ../dataset/gen-word-920-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1030 max words, 200 samples - at ../dataset/gen-word-1030-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1250 max words, 200 samples - at ../dataset/gen-word-1250-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1085 max words - at ../dataset/shuffle-word-1085-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1020 max words, 200 samples - at ../dataset/gen-word-1020-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 570 max words - at ../dataset/shuffle-word-570-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 750 max words - at ../dataset/shuffle-word-750-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1555 max words - at ../dataset/shuffle-word-1555-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 965 max words, 200 samples - at ../dataset/gen-word-965-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 615 max words, 200 samples - at ../dataset/gen-word-615-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 915 max words, 200 samples - at ../dataset/gen-word-915-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 42 samples (20 token repeat) - 1370 max words - at ../dataset/shuffle-word-1370-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1070 max words - at ../dataset/shuffle-word-1070-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 725 max words, 200 samples - at ../dataset/gen-word-725-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1150 max words, 200 samples - at ../dataset/gen-word-1150-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 935 max words, 200 samples - at ../dataset/gen-word-935-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1995 max words - at ../dataset/shuffle-word-1995-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 760 max words, 200 samples - at ../dataset/gen-word-760-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 640 max words - at ../dataset/shuffle-word-640-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 64 samples (20 token repeat) - 900 max words - at ../dataset/shuffle-word-900-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1835 max words, 200 samples - at ../dataset/gen-word-1835-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1255 max words, 200 samples - at ../dataset/gen-word-1255-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 59 samples (20 token repeat) - 1200 max words - at ../dataset/shuffle-word-1200-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 735 max words - at ../dataset/shuffle-word-735-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 855 max words, 200 samples - at ../dataset/gen-word-855-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 875 max words, 200 samples - at ../dataset/gen-word-875-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 125 max words, 200 samples - at ../dataset/gen-word-125-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1925 max words - at ../dataset/shuffle-word-1925-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1795 max words, 200 samples - at ../dataset/gen-word-1795-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 81 samples (20 token repeat) - 650 max words - at ../dataset/shuffle-word-650-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 735 max words, 200 samples - at ../dataset/gen-word-735-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 970 max words, 200 samples - at ../dataset/gen-word-970-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 189 samples (20 token repeat) - 245 max words - at ../dataset/shuffle-word-245-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 47 samples (20 token repeat) - 1270 max words - at ../dataset/shuffle-word-1270-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1185 max words, 200 samples - at ../dataset/gen-word-1185-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 730 max words, 200 samples - at ../dataset/gen-word-730-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 555 max words, 200 samples - at ../dataset/gen-word-555-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1795 max words - at ../dataset/shuffle-word-1795-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1180 max words, 200 samples - at ../dataset/gen-word-1180-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1755 max words - at ../dataset/shuffle-word-1755-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 425 max words, 200 samples - at ../dataset/gen-word-425-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 142 samples (20 token repeat) - 390 max words - at ../dataset/shuffle-word-390-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1995 max words, 200 samples - at ../dataset/gen-word-1995-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 201 samples (20 token repeat) - 215 max words - at ../dataset/shuffle-word-215-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 500 max words, 200 samples - at ../dataset/gen-word-500-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 625 max words, 200 samples - at ../dataset/gen-word-625-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 430 max words, 200 samples - at ../dataset/gen-word-430-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1060 max words, 200 samples - at ../dataset/gen-word-1060-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1235 max words, 200 samples - at ../dataset/gen-word-1235-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1815 max words - at ../dataset/shuffle-word-1815-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1705 max words - at ../dataset/shuffle-word-1705-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 79 samples (20 token repeat) - 745 max words - at ../dataset/shuffle-word-745-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 316 samples (20 token repeat) - 145 max words - at ../dataset/shuffle-word-145-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 135 max words, 200 samples - at ../dataset/gen-word-135-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 825 max words, 200 samples - at ../dataset/gen-word-825-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1505 max words - at ../dataset/shuffle-word-1505-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1670 max words - at ../dataset/shuffle-word-1670-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 201 samples (20 token repeat) - 225 max words - at ../dataset/shuffle-word-225-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 670 max words, 200 samples - at ../dataset/gen-word-670-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1845 max words - at ../dataset/shuffle-word-1845-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1935 max words - at ../dataset/shuffle-word-1935-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1810 max words - at ../dataset/shuffle-word-1810-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1160 max words, 200 samples - at ../dataset/gen-word-1160-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 62 samples (20 token repeat) - 805 max words - at ../dataset/shuffle-word-805-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 48 samples (20 token repeat) - 1295 max words - at ../dataset/shuffle-word-1295-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 715 max words - at ../dataset/shuffle-word-715-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1000 max words, 200 samples - at ../dataset/gen-word-1000-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1980 max words, 200 samples - at ../dataset/gen-word-1980-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1535 max words, 200 samples - at ../dataset/gen-word-1535-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1670 max words, 200 samples - at ../dataset/gen-word-1670-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1820 max words - at ../dataset/shuffle-word-1820-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 250 max words, 200 samples - at ../dataset/gen-word-250-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 78 samples (20 token repeat) - 775 max words - at ../dataset/shuffle-word-775-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 99 samples (20 token repeat) - 585 max words - at ../dataset/shuffle-word-585-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1610 max words, 200 samples - at ../dataset/gen-word-1610-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1775 max words - at ../dataset/shuffle-word-1775-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 985 max words, 200 samples - at ../dataset/gen-word-985-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1390 max words, 200 samples - at ../dataset/gen-word-1390-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1060 max words - at ../dataset/shuffle-word-1060-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1960 max words - at ../dataset/shuffle-word-1960-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 750 max words, 200 samples - at ../dataset/gen-word-750-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1965 max words - at ../dataset/shuffle-word-1965-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 785 max words - at ../dataset/shuffle-word-785-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1615 max words, 200 samples - at ../dataset/gen-word-1615-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 117 samples (20 token repeat) - 415 max words - at ../dataset/shuffle-word-415-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1175 max words, 200 samples - at ../dataset/gen-word-1175-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 47 samples (20 token repeat) - 1300 max words - at ../dataset/shuffle-word-1300-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1625 max words, 200 samples - at ../dataset/gen-word-1625-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 470 max words, 200 samples - at ../dataset/gen-word-470-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 190 max words, 200 samples - at ../dataset/gen-word-190-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1870 max words - at ../dataset/shuffle-word-1870-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1190 max words - at ../dataset/shuffle-word-1190-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 695 max words, 200 samples - at ../dataset/gen-word-695-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 81 samples (20 token repeat) - 645 max words - at ../dataset/shuffle-word-645-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 600 max words, 200 samples - at ../dataset/gen-word-600-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 710 max words, 200 samples - at ../dataset/gen-word-710-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 610 max words - at ../dataset/shuffle-word-610-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1645 max words - at ../dataset/shuffle-word-1645-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1055 max words, 200 samples - at ../dataset/gen-word-1055-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1400 max words, 200 samples - at ../dataset/gen-word-1400-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1550 max words - at ../dataset/shuffle-word-1550-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1100 max words, 200 samples - at ../dataset/gen-word-1100-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 945 max words, 200 samples - at ../dataset/gen-word-945-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1230 max words, 200 samples - at ../dataset/gen-word-1230-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 505 max words - at ../dataset/shuffle-word-505-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1325 max words, 200 samples - at ../dataset/gen-word-1325-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1305 max words, 200 samples - at ../dataset/gen-word-1305-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1510 max words, 200 samples - at ../dataset/gen-word-1510-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 79 samples (20 token repeat) - 795 max words - at ../dataset/shuffle-word-795-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1205 max words, 200 samples - at ../dataset/gen-word-1205-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1120 max words, 200 samples - at ../dataset/gen-word-1120-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1005 max words - at ../dataset/shuffle-word-1005-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1090 max words - at ../dataset/shuffle-word-1090-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1375 max words, 200 samples - at ../dataset/gen-word-1375-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1830 max words, 200 samples - at ../dataset/gen-word-1830-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1190 max words, 200 samples - at ../dataset/gen-word-1190-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 550 max words, 200 samples - at ../dataset/gen-word-550-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 880 max words, 200 samples - at ../dataset/gen-word-880-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1415 max words - at ../dataset/shuffle-word-1415-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1215 max words, 200 samples - at ../dataset/gen-word-1215-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 765 max words, 200 samples - at ../dataset/gen-word-765-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 141 samples (20 token repeat) - 350 max words - at ../dataset/shuffle-word-350-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1560 max words, 200 samples - at ../dataset/gen-word-1560-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 186 samples (20 token repeat) - 250 max words - at ../dataset/shuffle-word-250-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1505 max words, 200 samples - at ../dataset/gen-word-1505-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1460 max words, 200 samples - at ../dataset/gen-word-1460-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 420 max words, 200 samples - at ../dataset/gen-word-420-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 590 max words, 200 samples - at ../dataset/gen-word-590-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1425 max words, 200 samples - at ../dataset/gen-word-1425-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1225 max words, 200 samples - at ../dataset/gen-word-1225-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1050 max words, 200 samples - at ../dataset/gen-word-1050-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1495 max words, 200 samples - at ../dataset/gen-word-1495-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 540 max words, 200 samples - at ../dataset/gen-word-540-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1540 max words - at ../dataset/shuffle-word-1540-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 101 samples (20 token repeat) - 575 max words - at ../dataset/shuffle-word-575-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 64 samples (20 token repeat) - 880 max words - at ../dataset/shuffle-word-880-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1580 max words - at ../dataset/shuffle-word-1580-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 675 max words, 200 samples - at ../dataset/gen-word-675-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 585 max words, 200 samples - at ../dataset/gen-word-585-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1405 max words - at ../dataset/shuffle-word-1405-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 370 max words, 200 samples - at ../dataset/gen-word-370-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1750 max words, 200 samples - at ../dataset/gen-word-1750-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 310 max words, 200 samples - at ../dataset/gen-word-310-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1550 max words, 200 samples - at ../dataset/gen-word-1550-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1980 max words - at ../dataset/shuffle-word-1980-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1975 max words - at ../dataset/shuffle-word-1975-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1520 max words - at ../dataset/shuffle-word-1520-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1260 max words, 200 samples - at ../dataset/gen-word-1260-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1450 max words, 200 samples - at ../dataset/gen-word-1450-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1010 max words, 200 samples - at ../dataset/gen-word-1010-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1350 max words, 200 samples - at ../dataset/gen-word-1350-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1035 max words, 200 samples - at ../dataset/gen-word-1035-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 2000 max words - at ../dataset/shuffle-word-2000-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 535 max words, 200 samples - at ../dataset/gen-word-535-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1435 max words, 200 samples - at ../dataset/gen-word-1435-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1985 max words - at ../dataset/shuffle-word-1985-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1210 max words, 200 samples - at ../dataset/gen-word-1210-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 630 max words, 200 samples - at ../dataset/gen-word-630-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 185 samples (20 token repeat) - 265 max words - at ../dataset/shuffle-word-265-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1800 max words, 200 samples - at ../dataset/gen-word-1800-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 635 max words, 200 samples - at ../dataset/gen-word-635-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 485 max words, 200 samples - at ../dataset/gen-word-485-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1145 max words, 200 samples - at ../dataset/gen-word-1145-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1815 max words, 200 samples - at ../dataset/gen-word-1815-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1420 max words, 200 samples - at ../dataset/gen-word-1420-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1805 max words - at ../dataset/shuffle-word-1805-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 66 samples (20 token repeat) - 885 max words - at ../dataset/shuffle-word-885-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 510 max words, 200 samples - at ../dataset/gen-word-510-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1990 max words - at ../dataset/shuffle-word-1990-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1155 max words, 200 samples - at ../dataset/gen-word-1155-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1270 max words, 200 samples - at ../dataset/gen-word-1270-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 510 max words - at ../dataset/shuffle-word-510-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1365 max words, 200 samples - at ../dataset/gen-word-1365-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 860 max words, 200 samples - at ../dataset/gen-word-860-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1660 max words, 200 samples - at ../dataset/gen-word-1660-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1240 max words, 200 samples - at ../dataset/gen-word-1240-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1355 max words, 200 samples - at ../dataset/gen-word-1355-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1295 max words, 200 samples - at ../dataset/gen-word-1295-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1265 max words, 200 samples - at ../dataset/gen-word-1265-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 745 max words, 200 samples - at ../dataset/gen-word-745-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1095 max words - at ../dataset/shuffle-word-1095-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1825 max words - at ../dataset/shuffle-word-1825-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 790 max words, 200 samples - at ../dataset/gen-word-790-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 64 samples (20 token repeat) - 850 max words - at ../dataset/shuffle-word-850-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1850 max words - at ../dataset/shuffle-word-1850-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1745 max words, 200 samples - at ../dataset/gen-word-1745-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1605 max words, 200 samples - at ../dataset/gen-word-1605-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 62 samples (20 token repeat) - 810 max words - at ../dataset/shuffle-word-810-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1735 max words - at ../dataset/shuffle-word-1735-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1525 max words, 200 samples - at ../dataset/gen-word-1525-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 64 samples (20 token repeat) - 865 max words - at ../dataset/shuffle-word-865-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1800 max words - at ../dataset/shuffle-word-1800-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 655 max words - at ../dataset/shuffle-word-655-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1465 max words, 200 samples - at ../dataset/gen-word-1465-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1405 max words, 200 samples - at ../dataset/gen-word-1405-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1745 max words - at ../dataset/shuffle-word-1745-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1835 max words - at ../dataset/shuffle-word-1835-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1555 max words, 200 samples - at ../dataset/gen-word-1555-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1850 max words, 200 samples - at ../dataset/gen-word-1850-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1700 max words - at ../dataset/shuffle-word-1700-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1315 max words, 200 samples - at ../dataset/gen-word-1315-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1930 max words, 200 samples - at ../dataset/gen-word-1930-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 640 max words, 200 samples - at ../dataset/gen-word-640-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1860 max words - at ../dataset/shuffle-word-1860-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1575 max words - at ../dataset/shuffle-word-1575-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1640 max words, 200 samples - at ../dataset/gen-word-1640-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 650 max words, 200 samples - at ../dataset/gen-word-650-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1340 max words, 200 samples - at ../dataset/gen-word-1340-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1685 max words - at ../dataset/shuffle-word-1685-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 51 samples (20 token repeat) - 1235 max words - at ../dataset/shuffle-word-1235-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 795 max words, 200 samples - at ../dataset/gen-word-795-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1310 max words, 200 samples - at ../dataset/gen-word-1310-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1870 max words, 200 samples - at ../dataset/gen-word-1870-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1575 max words, 200 samples - at ../dataset/gen-word-1575-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1290 max words, 200 samples - at ../dataset/gen-word-1290-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1915 max words, 200 samples - at ../dataset/gen-word-1915-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1475 max words - at ../dataset/shuffle-word-1475-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1880 max words - at ../dataset/shuffle-word-1880-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 705 max words, 200 samples - at ../dataset/gen-word-705-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1425 max words - at ../dataset/shuffle-word-1425-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 62 samples (20 token repeat) - 815 max words - at ../dataset/shuffle-word-815-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1645 max words, 200 samples - at ../dataset/gen-word-1645-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1710 max words, 200 samples - at ../dataset/gen-word-1710-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1315 max words - at ../dataset/shuffle-word-1315-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1570 max words, 200 samples - at ../dataset/gen-word-1570-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 41 samples (20 token repeat) - 1325 max words - at ../dataset/shuffle-word-1325-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 63 samples (20 token repeat) - 875 max words - at ../dataset/shuffle-word-875-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 120 samples (20 token repeat) - 410 max words - at ../dataset/shuffle-word-410-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 980 max words, 200 samples - at ../dataset/gen-word-980-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1940 max words, 200 samples - at ../dataset/gen-word-1940-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1925 max words, 200 samples - at ../dataset/gen-word-1925-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1970 max words, 200 samples - at ../dataset/gen-word-1970-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 115 samples (20 token repeat) - 485 max words - at ../dataset/shuffle-word-485-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1075 max words, 200 samples - at ../dataset/gen-word-1075-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1690 max words, 200 samples - at ../dataset/gen-word-1690-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1845 max words, 200 samples - at ../dataset/gen-word-1845-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 285 max words, 200 samples - at ../dataset/gen-word-285-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1730 max words, 200 samples - at ../dataset/gen-word-1730-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1700 max words, 200 samples - at ../dataset/gen-word-1700-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1285 max words, 200 samples - at ../dataset/gen-word-1285-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1935 max words, 200 samples - at ../dataset/gen-word-1935-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1440 max words, 200 samples - at ../dataset/gen-word-1440-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1540 max words, 200 samples - at ../dataset/gen-word-1540-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 685 max words, 200 samples - at ../dataset/gen-word-685-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 700 max words - at ../dataset/shuffle-word-700-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1960 max words, 200 samples - at ../dataset/gen-word-1960-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1330 max words, 200 samples - at ../dataset/gen-word-1330-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1630 max words, 200 samples - at ../dataset/gen-word-1630-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1330 max words - at ../dataset/shuffle-word-1330-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 49 samples (20 token repeat) - 1240 max words - at ../dataset/shuffle-word-1240-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1545 max words, 200 samples - at ../dataset/gen-word-1545-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1595 max words, 200 samples - at ../dataset/gen-word-1595-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 116 samples (20 token repeat) - 460 max words - at ../dataset/shuffle-word-460-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 835 max words, 200 samples - at ../dataset/gen-word-835-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1875 max words, 200 samples - at ../dataset/gen-word-1875-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1590 max words, 200 samples - at ../dataset/gen-word-1590-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 720 max words, 200 samples - at ../dataset/gen-word-720-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1335 max words, 200 samples - at ../dataset/gen-word-1335-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1880 max words, 200 samples - at ../dataset/gen-word-1880-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1345 max words, 200 samples - at ../dataset/gen-word-1345-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1950 max words - at ../dataset/shuffle-word-1950-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1805 max words, 200 samples - at ../dataset/gen-word-1805-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 47 samples (20 token repeat) - 1285 max words - at ../dataset/shuffle-word-1285-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 975 max words, 200 samples - at ../dataset/gen-word-975-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 810 max words, 200 samples - at ../dataset/gen-word-810-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 940 max words, 200 samples - at ../dataset/gen-word-940-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1585 max words, 200 samples - at ../dataset/gen-word-1585-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 405 max words, 200 samples - at ../dataset/gen-word-405-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1750 max words - at ../dataset/shuffle-word-1750-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1865 max words, 200 samples - at ../dataset/gen-word-1865-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1635 max words - at ../dataset/shuffle-word-1635-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 710 max words - at ../dataset/shuffle-word-710-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 119 samples (20 token repeat) - 420 max words - at ../dataset/shuffle-word-420-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 790 max words - at ../dataset/shuffle-word-790-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1790 max words - at ../dataset/shuffle-word-1790-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 865 max words, 200 samples - at ../dataset/gen-word-865-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 560 max words, 200 samples - at ../dataset/gen-word-560-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 465 max words, 200 samples - at ../dataset/gen-word-465-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1475 max words, 200 samples - at ../dataset/gen-word-1475-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 800 max words - at ../dataset/shuffle-word-800-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1380 max words, 200 samples - at ../dataset/gen-word-1380-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1635 max words, 200 samples - at ../dataset/gen-word-1635-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1580 max words, 200 samples - at ../dataset/gen-word-1580-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1890 max words, 200 samples - at ../dataset/gen-word-1890-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1885 max words, 200 samples - at ../dataset/gen-word-1885-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1910 max words, 200 samples - at ../dataset/gen-word-1910-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1300 max words, 200 samples - at ../dataset/gen-word-1300-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1370 max words, 200 samples - at ../dataset/gen-word-1370-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1790 max words, 200 samples - at ../dataset/gen-word-1790-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 885 max words, 200 samples - at ../dataset/gen-word-885-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1735 max words, 200 samples - at ../dataset/gen-word-1735-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1810 max words, 200 samples - at ../dataset/gen-word-1810-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1430 max words, 200 samples - at ../dataset/gen-word-1430-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 2000 max words, 200 samples - at ../dataset/gen-word-2000-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 50 samples (20 token repeat) - 1220 max words - at ../dataset/shuffle-word-1220-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1785 max words - at ../dataset/shuffle-word-1785-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 80 samples (20 token repeat) - 765 max words - at ../dataset/shuffle-word-765-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1410 max words, 200 samples - at ../dataset/gen-word-1410-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1490 max words, 200 samples - at ../dataset/gen-word-1490-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1565 max words, 200 samples - at ../dataset/gen-word-1565-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1520 max words, 200 samples - at ../dataset/gen-word-1520-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 99 samples (20 token repeat) - 560 max words - at ../dataset/shuffle-word-560-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1200 max words, 200 samples - at ../dataset/gen-word-1200-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1990 max words, 200 samples - at ../dataset/gen-word-1990-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1760 max words, 200 samples - at ../dataset/gen-word-1760-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 475 max words, 200 samples - at ../dataset/gen-word-475-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 890 max words, 200 samples - at ../dataset/gen-word-890-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1705 max words, 200 samples - at ../dataset/gen-word-1705-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1570 max words - at ../dataset/shuffle-word-1570-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 830 max words, 200 samples - at ../dataset/gen-word-830-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 755 max words, 200 samples - at ../dataset/gen-word-755-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1840 max words, 200 samples - at ../dataset/gen-word-1840-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1900 max words, 200 samples - at ../dataset/gen-word-1900-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1740 max words, 200 samples - at ../dataset/gen-word-1740-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1500 max words, 200 samples - at ../dataset/gen-word-1500-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 565 max words, 200 samples - at ../dataset/gen-word-565-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1655 max words, 200 samples - at ../dataset/gen-word-1655-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1385 max words, 200 samples - at ../dataset/gen-word-1385-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 780 max words, 200 samples - at ../dataset/gen-word-780-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1955 max words, 200 samples - at ../dataset/gen-word-1955-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1245 max words, 200 samples - at ../dataset/gen-word-1245-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 81 samples (20 token repeat) - 675 max words - at ../dataset/shuffle-word-675-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1065 max words - at ../dataset/shuffle-word-1065-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1760 max words - at ../dataset/shuffle-word-1760-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1690 max words - at ../dataset/shuffle-word-1690-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1130 max words - at ../dataset/shuffle-word-1130-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1730 max words - at ../dataset/shuffle-word-1730-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 120 samples (20 token repeat) - 425 max words - at ../dataset/shuffle-word-425-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 49 samples (20 token repeat) - 1260 max words - at ../dataset/shuffle-word-1260-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 64 samples (20 token repeat) - 860 max words - at ../dataset/shuffle-word-860-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 81 samples (20 token repeat) - 695 max words - at ../dataset/shuffle-word-695-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1825 max words, 200 samples - at ../dataset/gen-word-1825-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1725 max words, 200 samples - at ../dataset/gen-word-1725-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 820 max words, 200 samples - at ../dataset/gen-word-820-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1965 max words, 200 samples - at ../dataset/gen-word-1965-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1495 max words - at ../dataset/shuffle-word-1495-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 530 max words - at ../dataset/shuffle-word-530-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 100 samples (20 token repeat) - 535 max words - at ../dataset/shuffle-word-535-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 775 max words, 200 samples - at ../dataset/gen-word-775-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1650 max words - at ../dataset/shuffle-word-1650-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1485 max words, 200 samples - at ../dataset/gen-word-1485-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1595 max words - at ../dataset/shuffle-word-1595-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1985 max words, 200 samples - at ../dataset/gen-word-1985-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 40 samples (20 token repeat) - 1900 max words - at ../dataset/shuffle-word-1900-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1920 max words, 200 samples - at ../dataset/gen-word-1920-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1755 max words, 200 samples - at ../dataset/gen-word-1755-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1945 max words, 200 samples - at ../dataset/gen-word-1945-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1715 max words, 200 samples - at ../dataset/gen-word-1715-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 815 max words, 200 samples - at ../dataset/gen-word-815-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 60 samples (20 token repeat) - 1145 max words - at ../dataset/shuffle-word-1145-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 460 max words, 200 samples - at ../dataset/gen-word-460-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1895 max words, 200 samples - at ../dataset/gen-word-1895-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated a single JSONL file with 140 samples (20 token repeat) - 365 max words - at ../dataset/shuffle-word-365-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1515 max words, 200 samples - at ../dataset/gen-word-1515-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1280 max words, 200 samples - at ../dataset/gen-word-1280-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1125 max words, 200 samples - at ../dataset/gen-word-1125-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1950 max words, 200 samples - at ../dataset/gen-word-1950-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1445 max words, 200 samples - at ../dataset/gen-word-1445-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 515 max words, 200 samples - at ../dataset/gen-word-515-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1170 max words, 200 samples - at ../dataset/gen-word-1170-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1680 max words, 200 samples - at ../dataset/gen-word-1680-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1820 max words, 200 samples - at ../dataset/gen-word-1820-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1770 max words, 200 samples - at ../dataset/gen-word-1770-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1090 max words, 200 samples - at ../dataset/gen-word-1090-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 805 max words, 200 samples - at ../dataset/gen-word-805-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 520 max words, 200 samples - at ../dataset/gen-word-520-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 660 max words, 200 samples - at ../dataset/gen-word-660-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 800 max words, 200 samples - at ../dataset/gen-word-800-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 845 max words, 200 samples - at ../dataset/gen-word-845-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1855 max words, 200 samples - at ../dataset/gen-word-1855-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 770 max words, 200 samples - at ../dataset/gen-word-770-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1395 max words, 200 samples - at ../dataset/gen-word-1395-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 665 max words, 200 samples - at ../dataset/gen-word-665-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1275 max words, 200 samples - at ../dataset/gen-word-1275-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1675 max words, 200 samples - at ../dataset/gen-word-1675-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1165 max words, 200 samples - at ../dataset/gen-word-1165-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1600 max words, 200 samples - at ../dataset/gen-word-1600-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1415 max words, 200 samples - at ../dataset/gen-word-1415-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1905 max words, 200 samples - at ../dataset/gen-word-1905-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1695 max words, 200 samples - at ../dataset/gen-word-1695-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1775 max words, 200 samples - at ../dataset/gen-word-1775-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1780 max words, 200 samples - at ../dataset/gen-word-1780-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1720 max words, 200 samples - at ../dataset/gen-word-1720-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1785 max words, 200 samples - at ../dataset/gen-word-1785-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1665 max words, 200 samples - at ../dataset/gen-word-1665-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1620 max words, 200 samples - at ../dataset/gen-word-1620-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Generated JSONL file with - 1765 max words, 200 samples - at ../dataset/gen-word-1765-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Done ##\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "total 965M\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "drwxr-xr-x  2 root root   36K Sep  1 02:55 .\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "drwxr-xr-x 14 root root   302 Aug 31 21:58 ..\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   20K Sep  1 02:55 gen-word-10-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  106K Sep  1 02:55 gen-word-100-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.0M Sep  1 02:55 gen-word-1000-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.0M Sep  1 02:55 gen-word-1005-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.0M Sep  1 02:55 gen-word-1010-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.0M Sep  1 02:55 gen-word-1015-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.0M Sep  1 02:55 gen-word-1020-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.0M Sep  1 02:55 gen-word-1025-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.0M Sep  1 02:55 gen-word-1030-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.0M Sep  1 02:55 gen-word-1035-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.0M Sep  1 02:55 gen-word-1040-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.1M Sep  1 02:55 gen-word-1045-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  222K Sep  1 02:55 gen-word-105-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.1M Sep  1 02:55 gen-word-1050-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.1M Sep  1 02:55 gen-word-1055-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.1M Sep  1 02:55 gen-word-1060-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.1M Sep  1 02:55 gen-word-1065-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.1M Sep  1 02:55 gen-word-1070-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.1M Sep  1 02:55 gen-word-1075-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.1M Sep  1 02:55 gen-word-1080-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.1M Sep  1 02:55 gen-word-1085-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.1M Sep  1 02:55 gen-word-1090-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.1M Sep  1 02:55 gen-word-1095-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  233K Sep  1 02:55 gen-word-110-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.1M Sep  1 02:55 gen-word-1100-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.2M Sep  1 02:55 gen-word-1105-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.2M Sep  1 02:55 gen-word-1110-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.2M Sep  1 02:55 gen-word-1115-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.2M Sep  1 02:55 gen-word-1120-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.2M Sep  1 02:55 gen-word-1125-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.2M Sep  1 02:55 gen-word-1130-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.2M Sep  1 02:55 gen-word-1135-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.2M Sep  1 02:55 gen-word-1140-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.3M Sep  1 02:55 gen-word-1145-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  241K Sep  1 02:55 gen-word-115-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.3M Sep  1 02:55 gen-word-1150-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.3M Sep  1 02:55 gen-word-1155-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.3M Sep  1 02:55 gen-word-1160-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.3M Sep  1 02:55 gen-word-1165-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.3M Sep  1 02:55 gen-word-1170-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.3M Sep  1 02:55 gen-word-1175-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.3M Sep  1 02:55 gen-word-1180-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.3M Sep  1 02:55 gen-word-1185-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.3M Sep  1 02:55 gen-word-1190-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.3M Sep  1 02:55 gen-word-1195-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  248K Sep  1 02:55 gen-word-120-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.3M Sep  1 02:55 gen-word-1200-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.4M Sep  1 02:55 gen-word-1205-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.4M Sep  1 02:55 gen-word-1210-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.4M Sep  1 02:55 gen-word-1215-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.4M Sep  1 02:55 gen-word-1220-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.4M Sep  1 02:55 gen-word-1225-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.4M Sep  1 02:55 gen-word-1230-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.4M Sep  1 02:55 gen-word-1235-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.4M Sep  1 02:55 gen-word-1240-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.4M Sep  1 02:55 gen-word-1245-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  257K Sep  1 02:55 gen-word-125-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.4M Sep  1 02:55 gen-word-1250-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.4M Sep  1 02:55 gen-word-1255-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.5M Sep  1 02:55 gen-word-1260-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.5M Sep  1 02:55 gen-word-1265-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.5M Sep  1 02:55 gen-word-1270-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.5M Sep  1 02:55 gen-word-1275-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.5M Sep  1 02:55 gen-word-1280-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.5M Sep  1 02:55 gen-word-1285-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.5M Sep  1 02:55 gen-word-1290-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.5M Sep  1 02:55 gen-word-1295-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  269K Sep  1 02:55 gen-word-130-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.5M Sep  1 02:55 gen-word-1300-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.5M Sep  1 02:55 gen-word-1305-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.5M Sep  1 02:55 gen-word-1310-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.6M Sep  1 02:55 gen-word-1315-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.6M Sep  1 02:55 gen-word-1320-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.6M Sep  1 02:55 gen-word-1325-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.6M Sep  1 02:55 gen-word-1330-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.6M Sep  1 02:55 gen-word-1335-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.6M Sep  1 02:55 gen-word-1340-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.6M Sep  1 02:55 gen-word-1345-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  285K Sep  1 02:55 gen-word-135-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.6M Sep  1 02:55 gen-word-1350-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.6M Sep  1 02:55 gen-word-1355-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.7M Sep  1 02:55 gen-word-1360-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.7M Sep  1 02:55 gen-word-1365-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.7M Sep  1 02:55 gen-word-1370-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.7M Sep  1 02:55 gen-word-1375-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.7M Sep  1 02:55 gen-word-1380-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.7M Sep  1 02:55 gen-word-1385-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.7M Sep  1 02:55 gen-word-1390-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.7M Sep  1 02:55 gen-word-1395-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  293K Sep  1 02:55 gen-word-140-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.7M Sep  1 02:55 gen-word-1400-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.7M Sep  1 02:55 gen-word-1405-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.8M Sep  1 02:55 gen-word-1410-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.8M Sep  1 02:55 gen-word-1415-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.8M Sep  1 02:55 gen-word-1420-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.8M Sep  1 02:55 gen-word-1425-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.8M Sep  1 02:55 gen-word-1430-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.8M Sep  1 02:55 gen-word-1435-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.8M Sep  1 02:55 gen-word-1440-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.8M Sep  1 02:55 gen-word-1445-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  300K Sep  1 02:55 gen-word-145-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.8M Sep  1 02:55 gen-word-1450-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.8M Sep  1 02:55 gen-word-1455-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.8M Sep  1 02:55 gen-word-1460-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.9M Sep  1 02:55 gen-word-1465-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.9M Sep  1 02:55 gen-word-1470-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.9M Sep  1 02:55 gen-word-1475-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.9M Sep  1 02:55 gen-word-1480-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.9M Sep  1 02:55 gen-word-1485-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.9M Sep  1 02:55 gen-word-1490-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.9M Sep  1 02:55 gen-word-1495-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   25K Sep  1 02:55 gen-word-15-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  313K Sep  1 02:55 gen-word-150-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.9M Sep  1 02:55 gen-word-1500-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.0M Sep  1 02:55 gen-word-1505-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.9M Sep  1 02:55 gen-word-1510-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.0M Sep  1 02:55 gen-word-1515-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.9M Sep  1 02:55 gen-word-1520-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.0M Sep  1 02:55 gen-word-1525-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.0M Sep  1 02:55 gen-word-1530-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.0M Sep  1 02:55 gen-word-1535-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.0M Sep  1 02:55 gen-word-1540-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.0M Sep  1 02:55 gen-word-1545-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  322K Sep  1 02:55 gen-word-155-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.0M Sep  1 02:55 gen-word-1550-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.0M Sep  1 02:55 gen-word-1555-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.0M Sep  1 02:55 gen-word-1560-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.0M Sep  1 02:55 gen-word-1565-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.0M Sep  1 02:55 gen-word-1570-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.0M Sep  1 02:55 gen-word-1575-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.1M Sep  1 02:55 gen-word-1580-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.1M Sep  1 02:55 gen-word-1585-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.1M Sep  1 02:55 gen-word-1590-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.1M Sep  1 02:55 gen-word-1595-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  334K Sep  1 02:55 gen-word-160-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.1M Sep  1 02:55 gen-word-1600-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.1M Sep  1 02:55 gen-word-1605-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.1M Sep  1 02:55 gen-word-1610-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.1M Sep  1 02:55 gen-word-1615-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.2M Sep  1 02:55 gen-word-1620-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.1M Sep  1 02:55 gen-word-1625-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.2M Sep  1 02:55 gen-word-1630-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.2M Sep  1 02:55 gen-word-1635-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.2M Sep  1 02:55 gen-word-1640-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.2M Sep  1 02:55 gen-word-1645-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  343K Sep  1 02:55 gen-word-165-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.2M Sep  1 02:55 gen-word-1650-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.2M Sep  1 02:55 gen-word-1655-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.2M Sep  1 02:55 gen-word-1660-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.2M Sep  1 02:55 gen-word-1665-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.2M Sep  1 02:55 gen-word-1670-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.2M Sep  1 02:55 gen-word-1675-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.2M Sep  1 02:55 gen-word-1680-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.2M Sep  1 02:55 gen-word-1685-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.3M Sep  1 02:55 gen-word-1690-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.3M Sep  1 02:55 gen-word-1695-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  353K Sep  1 02:55 gen-word-170-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.3M Sep  1 02:55 gen-word-1700-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.3M Sep  1 02:55 gen-word-1705-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.3M Sep  1 02:55 gen-word-1710-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.3M Sep  1 02:55 gen-word-1715-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.3M Sep  1 02:55 gen-word-1720-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.4M Sep  1 02:55 gen-word-1725-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.3M Sep  1 02:55 gen-word-1730-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.4M Sep  1 02:55 gen-word-1735-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.4M Sep  1 02:55 gen-word-1740-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.4M Sep  1 02:55 gen-word-1745-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  362K Sep  1 02:55 gen-word-175-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.4M Sep  1 02:55 gen-word-1750-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.4M Sep  1 02:55 gen-word-1755-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.4M Sep  1 02:55 gen-word-1760-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.4M Sep  1 02:55 gen-word-1765-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.4M Sep  1 02:55 gen-word-1770-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.4M Sep  1 02:55 gen-word-1775-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.4M Sep  1 02:55 gen-word-1780-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.5M Sep  1 02:55 gen-word-1785-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.5M Sep  1 02:55 gen-word-1790-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.5M Sep  1 02:55 gen-word-1795-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  371K Sep  1 02:55 gen-word-180-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.5M Sep  1 02:55 gen-word-1800-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.5M Sep  1 02:55 gen-word-1805-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.5M Sep  1 02:55 gen-word-1810-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.5M Sep  1 02:55 gen-word-1815-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.5M Sep  1 02:55 gen-word-1820-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.6M Sep  1 02:55 gen-word-1825-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.5M Sep  1 02:55 gen-word-1830-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.5M Sep  1 02:55 gen-word-1835-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.6M Sep  1 02:55 gen-word-1840-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.6M Sep  1 02:55 gen-word-1845-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  376K Sep  1 02:55 gen-word-185-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.6M Sep  1 02:55 gen-word-1850-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.6M Sep  1 02:55 gen-word-1855-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.6M Sep  1 02:55 gen-word-1860-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.6M Sep  1 02:55 gen-word-1865-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.6M Sep  1 02:55 gen-word-1870-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.6M Sep  1 02:55 gen-word-1875-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.6M Sep  1 02:55 gen-word-1880-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.7M Sep  1 02:55 gen-word-1885-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.7M Sep  1 02:55 gen-word-1890-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.7M Sep  1 02:55 gen-word-1895-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  392K Sep  1 02:55 gen-word-190-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.7M Sep  1 02:55 gen-word-1900-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.7M Sep  1 02:55 gen-word-1905-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.7M Sep  1 02:55 gen-word-1910-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.7M Sep  1 02:55 gen-word-1915-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.7M Sep  1 02:55 gen-word-1920-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.7M Sep  1 02:55 gen-word-1925-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.7M Sep  1 02:55 gen-word-1930-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.7M Sep  1 02:55 gen-word-1935-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.8M Sep  1 02:55 gen-word-1940-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.8M Sep  1 02:55 gen-word-1945-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  400K Sep  1 02:55 gen-word-195-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.8M Sep  1 02:55 gen-word-1950-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.8M Sep  1 02:55 gen-word-1955-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.8M Sep  1 02:55 gen-word-1960-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.8M Sep  1 02:55 gen-word-1965-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.8M Sep  1 02:55 gen-word-1970-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.8M Sep  1 02:55 gen-word-1975-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.8M Sep  1 02:55 gen-word-1980-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.9M Sep  1 02:55 gen-word-1985-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.9M Sep  1 02:55 gen-word-1990-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.8M Sep  1 02:55 gen-word-1995-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   30K Sep  1 02:55 gen-word-20-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  411K Sep  1 02:55 gen-word-200-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  3.9M Sep  1 02:55 gen-word-2000-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  419K Sep  1 02:55 gen-word-205-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  425K Sep  1 02:55 gen-word-210-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  441K Sep  1 02:55 gen-word-215-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  456K Sep  1 02:55 gen-word-220-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  456K Sep  1 02:55 gen-word-225-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  464K Sep  1 02:55 gen-word-230-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  475K Sep  1 02:55 gen-word-235-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  492K Sep  1 02:55 gen-word-240-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  500K Sep  1 02:55 gen-word-245-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   35K Sep  1 02:55 gen-word-25-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  510K Sep  1 02:55 gen-word-250-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  510K Sep  1 02:55 gen-word-255-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 gen-word-260-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  536K Sep  1 02:55 gen-word-265-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  548K Sep  1 02:55 gen-word-270-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  560K Sep  1 02:55 gen-word-275-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  568K Sep  1 02:55 gen-word-280-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  574K Sep  1 02:55 gen-word-285-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  586K Sep  1 02:55 gen-word-290-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  595K Sep  1 02:55 gen-word-295-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   40K Sep  1 02:55 gen-word-30-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  602K Sep  1 02:55 gen-word-300-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  613K Sep  1 02:55 gen-word-305-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  625K Sep  1 02:55 gen-word-310-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  629K Sep  1 02:55 gen-word-315-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  652K Sep  1 02:55 gen-word-320-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  652K Sep  1 02:55 gen-word-325-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  666K Sep  1 02:55 gen-word-330-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  668K Sep  1 02:55 gen-word-335-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  681K Sep  1 02:55 gen-word-340-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  675K Sep  1 02:55 gen-word-345-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   43K Sep  1 02:55 gen-word-35-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  699K Sep  1 02:55 gen-word-350-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  722K Sep  1 02:55 gen-word-355-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  724K Sep  1 02:55 gen-word-360-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  733K Sep  1 02:55 gen-word-365-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  733K Sep  1 02:55 gen-word-370-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  749K Sep  1 02:55 gen-word-375-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  755K Sep  1 02:55 gen-word-380-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  771K Sep  1 02:55 gen-word-385-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  775K Sep  1 02:55 gen-word-390-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  798K Sep  1 02:55 gen-word-395-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   50K Sep  1 02:55 gen-word-40-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  803K Sep  1 02:55 gen-word-400-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  810K Sep  1 02:55 gen-word-405-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  812K Sep  1 02:55 gen-word-410-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  828K Sep  1 02:55 gen-word-415-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  845K Sep  1 02:55 gen-word-420-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  845K Sep  1 02:55 gen-word-425-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  859K Sep  1 02:55 gen-word-430-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  858K Sep  1 02:55 gen-word-435-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  876K Sep  1 02:55 gen-word-440-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  882K Sep  1 02:55 gen-word-445-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   52K Sep  1 02:55 gen-word-45-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  903K Sep  1 02:55 gen-word-450-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  910K Sep  1 02:55 gen-word-455-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  915K Sep  1 02:55 gen-word-460-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  917K Sep  1 02:55 gen-word-465-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  941K Sep  1 02:55 gen-word-470-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  948K Sep  1 02:55 gen-word-475-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  955K Sep  1 02:55 gen-word-480-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  966K Sep  1 02:55 gen-word-485-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  975K Sep  1 02:55 gen-word-490-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  982K Sep  1 02:55 gen-word-495-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   15K Sep  1 02:55 gen-word-5-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   58K Sep  1 02:55 gen-word-50-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  994K Sep  1 02:55 gen-word-500-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  997K Sep  1 02:55 gen-word-505-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root 1010K Sep  1 02:55 gen-word-510-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root 1022K Sep  1 02:55 gen-word-515-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.1M Sep  1 02:55 gen-word-520-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.1M Sep  1 02:55 gen-word-525-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.1M Sep  1 02:55 gen-word-530-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.1M Sep  1 02:55 gen-word-535-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.1M Sep  1 02:55 gen-word-540-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.1M Sep  1 02:55 gen-word-545-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   63K Sep  1 02:55 gen-word-55-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.1M Sep  1 02:55 gen-word-550-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.1M Sep  1 02:55 gen-word-555-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.1M Sep  1 02:55 gen-word-560-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.1M Sep  1 02:55 gen-word-565-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.1M Sep  1 02:55 gen-word-570-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.2M Sep  1 02:55 gen-word-575-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.2M Sep  1 02:55 gen-word-580-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.2M Sep  1 02:55 gen-word-585-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.2M Sep  1 02:55 gen-word-590-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.2M Sep  1 02:55 gen-word-595-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   68K Sep  1 02:55 gen-word-60-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.2M Sep  1 02:55 gen-word-600-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.2M Sep  1 02:55 gen-word-605-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.2M Sep  1 02:55 gen-word-610-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.2M Sep  1 02:55 gen-word-615-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.3M Sep  1 02:55 gen-word-620-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.3M Sep  1 02:55 gen-word-625-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.3M Sep  1 02:55 gen-word-630-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.3M Sep  1 02:55 gen-word-635-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.3M Sep  1 02:55 gen-word-640-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.3M Sep  1 02:55 gen-word-645-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   72K Sep  1 02:55 gen-word-65-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.3M Sep  1 02:55 gen-word-650-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.3M Sep  1 02:55 gen-word-655-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.3M Sep  1 02:55 gen-word-660-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.3M Sep  1 02:55 gen-word-665-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.3M Sep  1 02:55 gen-word-670-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.3M Sep  1 02:55 gen-word-675-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.3M Sep  1 02:55 gen-word-680-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.4M Sep  1 02:55 gen-word-685-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.4M Sep  1 02:55 gen-word-690-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.4M Sep  1 02:55 gen-word-695-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   79K Sep  1 02:55 gen-word-70-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.4M Sep  1 02:55 gen-word-700-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.4M Sep  1 02:55 gen-word-705-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.4M Sep  1 02:55 gen-word-710-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.4M Sep  1 02:55 gen-word-715-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.4M Sep  1 02:55 gen-word-720-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.4M Sep  1 02:55 gen-word-725-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.5M Sep  1 02:55 gen-word-730-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.5M Sep  1 02:55 gen-word-735-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.5M Sep  1 02:55 gen-word-740-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.5M Sep  1 02:55 gen-word-745-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   83K Sep  1 02:55 gen-word-75-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.5M Sep  1 02:55 gen-word-750-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.5M Sep  1 02:55 gen-word-755-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.5M Sep  1 02:55 gen-word-760-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.5M Sep  1 02:55 gen-word-765-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.5M Sep  1 02:55 gen-word-770-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.5M Sep  1 02:55 gen-word-775-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.6M Sep  1 02:55 gen-word-780-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.5M Sep  1 02:55 gen-word-785-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.6M Sep  1 02:55 gen-word-790-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.6M Sep  1 02:55 gen-word-795-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   89K Sep  1 02:55 gen-word-80-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.6M Sep  1 02:55 gen-word-800-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.6M Sep  1 02:55 gen-word-805-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.6M Sep  1 02:55 gen-word-810-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.6M Sep  1 02:55 gen-word-815-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.6M Sep  1 02:55 gen-word-820-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.6M Sep  1 02:55 gen-word-825-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.7M Sep  1 02:55 gen-word-830-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.7M Sep  1 02:55 gen-word-835-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.7M Sep  1 02:55 gen-word-840-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.7M Sep  1 02:55 gen-word-845-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   91K Sep  1 02:55 gen-word-85-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.7M Sep  1 02:55 gen-word-850-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.7M Sep  1 02:55 gen-word-855-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.7M Sep  1 02:55 gen-word-860-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.7M Sep  1 02:55 gen-word-865-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.7M Sep  1 02:55 gen-word-870-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.7M Sep  1 02:55 gen-word-875-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.7M Sep  1 02:55 gen-word-880-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.7M Sep  1 02:55 gen-word-885-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.8M Sep  1 02:55 gen-word-890-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.8M Sep  1 02:55 gen-word-895-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   99K Sep  1 02:55 gen-word-90-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.8M Sep  1 02:55 gen-word-900-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.8M Sep  1 02:55 gen-word-905-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.8M Sep  1 02:55 gen-word-910-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.8M Sep  1 02:55 gen-word-915-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.8M Sep  1 02:55 gen-word-920-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.8M Sep  1 02:55 gen-word-925-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.8M Sep  1 02:55 gen-word-930-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.8M Sep  1 02:55 gen-word-935-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.8M Sep  1 02:55 gen-word-940-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.9M Sep  1 02:55 gen-word-945-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  105K Sep  1 02:55 gen-word-95-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.9M Sep  1 02:55 gen-word-950-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.9M Sep  1 02:55 gen-word-955-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.9M Sep  1 02:55 gen-word-960-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.9M Sep  1 02:55 gen-word-965-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.9M Sep  1 02:55 gen-word-970-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.9M Sep  1 02:55 gen-word-975-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.9M Sep  1 02:55 gen-word-980-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  1.9M Sep  1 02:55 gen-word-985-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.0M Sep  1 02:55 gen-word-990-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  2.0M Sep  1 02:55 gen-word-995-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   52K Sep  1 02:55 shuffle-word-10-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   30K Sep  1 02:55 shuffle-word-100-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-1000-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-1005-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-1010-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-1015-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1020-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1025-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  517K Sep  1 02:55 shuffle-word-1030-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  526K Sep  1 02:55 shuffle-word-1035-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  518K Sep  1 02:55 shuffle-word-1040-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-1045-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  555K Sep  1 02:55 shuffle-word-105-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1050-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1055-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1060-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1065-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-1070-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-1075-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1080-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1085-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1090-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1095-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  554K Sep  1 02:55 shuffle-word-110-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1100-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1105-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1110-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-1115-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1120-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-1125-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1130-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1135-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1140-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-1145-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  554K Sep  1 02:55 shuffle-word-115-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-1150-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-1155-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-1160-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1165-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-1170-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  518K Sep  1 02:55 shuffle-word-1175-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1180-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-1185-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1190-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-1195-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  551K Sep  1 02:55 shuffle-word-120-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1200-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1205-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-1210-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1215-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1220-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-1225-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1230-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-1235-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1240-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1245-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  553K Sep  1 02:55 shuffle-word-125-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-1250-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1255-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1260-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1265-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1270-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1275-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-1280-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  518K Sep  1 02:55 shuffle-word-1285-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1290-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  518K Sep  1 02:55 shuffle-word-1295-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  549K Sep  1 02:55 shuffle-word-130-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1300-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1305-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-1310-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1315-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1320-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  517K Sep  1 02:55 shuffle-word-1325-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1330-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1335-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  518K Sep  1 02:55 shuffle-word-1340-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1345-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  546K Sep  1 02:55 shuffle-word-135-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1350-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1355-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1360-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1365-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1370-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1375-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1380-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1385-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1390-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1395-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  549K Sep  1 02:55 shuffle-word-140-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1400-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1405-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1410-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1415-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1420-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1425-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1430-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  518K Sep  1 02:55 shuffle-word-1435-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1440-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1445-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  543K Sep  1 02:55 shuffle-word-145-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1450-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1455-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1460-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1465-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1470-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1475-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1480-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1485-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1490-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1495-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   42K Sep  1 02:55 shuffle-word-15-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  540K Sep  1 02:55 shuffle-word-150-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-1500-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1505-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1510-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1515-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1520-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1525-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1530-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1535-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1540-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1545-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  551K Sep  1 02:55 shuffle-word-155-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1550-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1555-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1560-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-1565-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1570-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1575-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1580-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1585-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1590-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  518K Sep  1 02:55 shuffle-word-1595-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  548K Sep  1 02:55 shuffle-word-160-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1600-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1605-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1610-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1615-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  518K Sep  1 02:55 shuffle-word-1620-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1625-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1630-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1635-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1640-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1645-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  542K Sep  1 02:55 shuffle-word-165-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1650-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1655-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1660-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1665-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  518K Sep  1 02:55 shuffle-word-1670-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1675-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1680-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1685-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  516K Sep  1 02:55 shuffle-word-1690-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1695-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  547K Sep  1 02:55 shuffle-word-170-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1700-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1705-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  518K Sep  1 02:55 shuffle-word-1710-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1715-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1720-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1725-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1730-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1735-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1740-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1745-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  543K Sep  1 02:55 shuffle-word-175-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1750-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1755-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  518K Sep  1 02:55 shuffle-word-1760-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1765-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1770-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1775-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1780-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1785-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1790-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  518K Sep  1 02:55 shuffle-word-1795-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  542K Sep  1 02:55 shuffle-word-180-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1800-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1805-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1810-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1815-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-1820-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1825-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1830-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1835-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1840-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1845-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  540K Sep  1 02:55 shuffle-word-185-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  518K Sep  1 02:55 shuffle-word-1850-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1855-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1860-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-1865-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1870-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1875-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1880-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1885-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1890-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1895-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  544K Sep  1 02:55 shuffle-word-190-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1900-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1905-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1910-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-1915-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1920-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1925-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1930-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1935-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1940-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1945-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  543K Sep  1 02:55 shuffle-word-195-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1950-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1955-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1960-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1965-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-1970-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-1975-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-1980-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1985-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-1990-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-1995-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   35K Sep  1 02:55 shuffle-word-20-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  540K Sep  1 02:55 shuffle-word-200-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-2000-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  537K Sep  1 02:55 shuffle-word-205-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  534K Sep  1 02:55 shuffle-word-210-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  533K Sep  1 02:55 shuffle-word-215-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  531K Sep  1 02:55 shuffle-word-220-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  538K Sep  1 02:55 shuffle-word-225-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  536K Sep  1 02:55 shuffle-word-230-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  538K Sep  1 02:55 shuffle-word-235-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  536K Sep  1 02:55 shuffle-word-240-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  531K Sep  1 02:55 shuffle-word-245-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   37K Sep  1 02:55 shuffle-word-25-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  534K Sep  1 02:55 shuffle-word-250-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  534K Sep  1 02:55 shuffle-word-255-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  534K Sep  1 02:55 shuffle-word-260-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  532K Sep  1 02:55 shuffle-word-265-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  534K Sep  1 02:55 shuffle-word-270-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  537K Sep  1 02:55 shuffle-word-275-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  534K Sep  1 02:55 shuffle-word-280-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  532K Sep  1 02:55 shuffle-word-285-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  539K Sep  1 02:55 shuffle-word-290-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  536K Sep  1 02:55 shuffle-word-295-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   32K Sep  1 02:55 shuffle-word-30-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  529K Sep  1 02:55 shuffle-word-300-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  529K Sep  1 02:55 shuffle-word-305-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  529K Sep  1 02:55 shuffle-word-310-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  531K Sep  1 02:55 shuffle-word-315-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  529K Sep  1 02:55 shuffle-word-320-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  527K Sep  1 02:55 shuffle-word-325-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  531K Sep  1 02:55 shuffle-word-330-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  538K Sep  1 02:55 shuffle-word-335-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  528K Sep  1 02:55 shuffle-word-340-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  534K Sep  1 02:55 shuffle-word-345-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   34K Sep  1 02:55 shuffle-word-35-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  531K Sep  1 02:55 shuffle-word-350-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  532K Sep  1 02:55 shuffle-word-355-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  526K Sep  1 02:55 shuffle-word-360-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  529K Sep  1 02:55 shuffle-word-365-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  531K Sep  1 02:55 shuffle-word-370-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  533K Sep  1 02:55 shuffle-word-375-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  528K Sep  1 02:55 shuffle-word-380-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  528K Sep  1 02:55 shuffle-word-385-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  532K Sep  1 02:55 shuffle-word-390-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  531K Sep  1 02:55 shuffle-word-395-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   35K Sep  1 02:55 shuffle-word-40-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  532K Sep  1 02:55 shuffle-word-400-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  527K Sep  1 02:55 shuffle-word-405-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-410-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-415-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  530K Sep  1 02:55 shuffle-word-420-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  529K Sep  1 02:55 shuffle-word-425-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  527K Sep  1 02:55 shuffle-word-430-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  530K Sep  1 02:55 shuffle-word-435-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  530K Sep  1 02:55 shuffle-word-440-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-445-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   31K Sep  1 02:55 shuffle-word-45-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  527K Sep  1 02:55 shuffle-word-450-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-455-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  527K Sep  1 02:55 shuffle-word-460-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  527K Sep  1 02:55 shuffle-word-465-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  527K Sep  1 02:55 shuffle-word-470-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  528K Sep  1 02:55 shuffle-word-475-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-480-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  526K Sep  1 02:55 shuffle-word-485-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  529K Sep  1 02:55 shuffle-word-490-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  532K Sep  1 02:55 shuffle-word-495-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   85K Sep  1 02:55 shuffle-word-5-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   33K Sep  1 02:55 shuffle-word-50-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  528K Sep  1 02:55 shuffle-word-500-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  527K Sep  1 02:55 shuffle-word-505-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-510-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  529K Sep  1 02:55 shuffle-word-515-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  527K Sep  1 02:55 shuffle-word-520-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  527K Sep  1 02:55 shuffle-word-525-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  526K Sep  1 02:55 shuffle-word-530-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-535-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  526K Sep  1 02:55 shuffle-word-540-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  526K Sep  1 02:55 shuffle-word-545-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   32K Sep  1 02:55 shuffle-word-55-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-550-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  526K Sep  1 02:55 shuffle-word-555-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  526K Sep  1 02:55 shuffle-word-560-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  526K Sep  1 02:55 shuffle-word-565-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-570-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  528K Sep  1 02:55 shuffle-word-575-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  527K Sep  1 02:55 shuffle-word-580-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-585-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  527K Sep  1 02:55 shuffle-word-590-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  528K Sep  1 02:55 shuffle-word-595-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   31K Sep  1 02:55 shuffle-word-60-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  526K Sep  1 02:55 shuffle-word-600-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-605-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-610-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-615-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-620-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-625-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-630-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-635-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-640-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-645-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   30K Sep  1 02:55 shuffle-word-65-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  526K Sep  1 02:55 shuffle-word-650-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-655-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  526K Sep  1 02:55 shuffle-word-660-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-665-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-670-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-675-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  527K Sep  1 02:55 shuffle-word-680-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-685-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-690-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-695-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   29K Sep  1 02:55 shuffle-word-70-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-700-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-705-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-710-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-715-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-720-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-725-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  526K Sep  1 02:55 shuffle-word-730-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-735-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-740-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-745-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   31K Sep  1 02:55 shuffle-word-75-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  526K Sep  1 02:55 shuffle-word-750-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-755-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-760-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-765-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-770-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-775-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-780-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-785-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-790-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-795-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   29K Sep  1 02:55 shuffle-word-80-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-800-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-805-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-810-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-815-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-820-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-825-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-830-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-835-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-840-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-845-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   29K Sep  1 02:55 shuffle-word-85-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-850-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-855-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-860-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-865-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  527K Sep  1 02:55 shuffle-word-870-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-875-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-880-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-885-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-890-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  525K Sep  1 02:55 shuffle-word-895-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   29K Sep  1 02:55 shuffle-word-90-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-900-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-905-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-910-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-915-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-920-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-925-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-930-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-935-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-940-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-945-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   28K Sep  1 02:55 shuffle-word-95-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-950-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  521K Sep  1 02:55 shuffle-word-955-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-960-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  523K Sep  1 02:55 shuffle-word-965-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  520K Sep  1 02:55 shuffle-word-970-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  522K Sep  1 02:55 shuffle-word-975-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-980-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-985-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  519K Sep  1 02:55 shuffle-word-990-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root  524K Sep  1 02:55 shuffle-word-995-count.jsonl\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r--  1 root root   12K Sep  1 02:55 word-2-count.jsonl\n"
-     ]
-    }
-   ],
-   "source": [
-    "%%script bash\n",
-    "\n",
-    "########################################\n",
-    "# Generate the required jsonl dataset\n",
-    "########################################\n",
-    "\n",
-    "# Reset the dataset dir\n",
-    "mkdir -p ../dataset\n",
-    "rm -rf ../dataset/*.jsonl\n",
-    "\n",
-    "# Generate the various datasets\n",
-    "echo \"## Generating word reptition dataset ##\"\n",
-    "\n",
-    "#\n",
-    "# We reduce the training set for lower word count - and shift the focus upwards\n",
-    "#\n",
-    "python ../memory_script/gen_limited_prompt_completion_jsonl.py ../dataset/word-2-count.jsonl 2 100 &\n",
-    "for i in {5..100..5} \n",
-    "do\n",
-    "    python ../memory_script/gen_limited_prompt_completion_jsonl.py ../dataset/gen-word-$i-count.jsonl $i 100 & \n",
-    "    python ../memory_script/shuffle_limited_prompt_completion_jsonl.py ../dataset/shuffle-word-$i-count.jsonl $i 1 & \n",
-    "done\n",
-    "\n",
-    "#\n",
-    "# Ramping up the 105+ - 1050 words dataset\n",
-    "# \n",
-    "for i in {105..2000..5} \n",
-    "do\n",
-    "    python ../memory_script/gen_limited_prompt_completion_jsonl.py ../dataset/gen-word-$i-count.jsonl $i 200 & \n",
-    "    python ../memory_script/shuffle_limited_prompt_completion_jsonl.py ../dataset/shuffle-word-$i-count.jsonl $i 20 & \n",
-    "done\n",
-    "\n",
-    "wait\n",
-    "echo \"## Done ##\"\n",
-    "\n",
-    "ls -alh ../dataset/"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 10,
-   "id": "5aa5de6f",
-   "metadata": {
-    "execution": {
-     "iopub.execute_input": "2023-09-01T02:55:42.739200Z",
-     "iopub.status.busy": "2023-09-01T02:55:42.738940Z",
-     "iopub.status.idle": "2023-09-01T07:50:43.106269Z",
-     "shell.execute_reply": "2023-09-01T07:50:43.105241Z"
-    },
-    "papermill": {
-     "duration": 17701.34071,
-     "end_time": "2023-09-01T07:50:43.108386",
-     "exception": false,
-     "start_time": "2023-09-01T02:55:41.767676",
-     "status": "completed"
-    },
-    "tags": []
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Setting ds_accelerator to cuda (auto detect)\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[RWKV.model] Running RWKV model using 'torch-jit' with torch '2.0.1+cu118'\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "/usr/local/lib/python3.11/dist-packages/lightning/pytorch/cli.py:484: UserWarning: LightningCLI's args parameter is intended to run from within Python like if it were from the command line. To prevent mistakes it is not recommended to provide both args and command line arguments, got: sys.argv[1:]=['fit', '-c', '/actions-runner/_work/RWKV-infctx-trainer/RWKV-infctx-trainer/notebook/experiment/rwkv-x-exp/v5-memory/config-mem-template.yaml', '--trainer.logger.init_args.name=v5-L96-D1024-E0.1 - Mem-Tune ctx-2k (train-ctx=2k, deepspeed_stage_1)', '--trainer.strategy=deepspeed_stage_1', '--trainer.devices=auto', '--trainer.callbacks.init_args.dirpath=../checkpoint/v5-L96-D1024-E0_1-mem-ctx-2k/', '--model.lr_init=3e-4', '--model.lr_final=1e-4', '--data.max_token_size=2048', '--model.ctx_len=2048', '--model.bptt_learning_range=1', '--model.load_model=../model/v5-L96-D1024-E0_1-mem-ctx-1k.pth'], args=['fit', '-c', '/actions-runner/_work/RWKV-infctx-trainer/RWKV-infctx-trainer/notebook/experiment/rwkv-x-exp/v5-memory/config-mem-template.yaml', '--trainer.logger.init_args.name=v5-L96-D1024-E0.1 - Mem-Tune ctx-2k (train-ctx=2k, deepspeed_stage_1)', '--trainer.strategy=deepspeed_stage_1', '--trainer.devices=auto', '--trainer.callbacks.init_args.dirpath=../checkpoint/v5-L96-D1024-E0_1-mem-ctx-2k/', '--model.lr_init=3e-4', '--model.lr_final=1e-4', '--data.max_token_size=2048', '--model.ctx_len=2048', '--model.bptt_learning_range=1', '--model.load_model=../model/v5-L96-D1024-E0_1-mem-ctx-1k.pth'].\r\n",
-      "  rank_zero_warn(\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "/usr/local/lib/python3.11/dist-packages/lightning/fabric/utilities/seed.py:39: UserWarning: No seed found, seed set to 1802196061\r\n",
-      "  rank_zero_warn(f\"No seed found, seed set to {seed}\")\r\n",
-      "Global seed set to 1802196061\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\u001b[34m\u001b[1mwandb\u001b[0m: Currently logged in as: \u001b[33mpicocreator\u001b[0m (\u001b[33mrwkv-x-dev\u001b[0m). Use \u001b[1m`wandb login --relogin`\u001b[0m to force relogin\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\u001b[34m\u001b[1mwandb\u001b[0m: Tracking run with wandb version 0.15.9\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: Run data is saved locally in \u001b[35m\u001b[1m./wandb/run-20230901_025548-ztpntif6\u001b[0m\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: Run \u001b[1m`wandb offline`\u001b[0m to turn off syncing.\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: Syncing run \u001b[33mv5-L96-D1024-E0.1 - Mem-Tune ctx-2k (train-ctx=2k, deepspeed_stage_1)\u001b[0m\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: ⭐️ View project at \u001b[34m\u001b[4mhttps://wandb.ai/rwkv-x-dev/RWKV-X-Experiments\u001b[0m\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: 🚀 View run at \u001b[34m\u001b[4mhttps://wandb.ai/rwkv-x-dev/RWKV-X-Experiments/runs/ztpntif6\u001b[0m\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "/usr/local/lib/python3.11/dist-packages/lightning/fabric/connector.py:562: UserWarning: bf16 is supported for historical reasons but its usage is discouraged. Please set your precision to bf16-mixed instead!\r\n",
-      "  rank_zero_warn(\r\n",
-      "GPU available: True (cuda), used: True\r\n",
-      "TPU available: False, using: 0 TPU cores\r\n",
-      "IPU available: False, using: 0 IPUs\r\n",
-      "HPU available: False, using: 0 HPUs\r\n",
-      "\r\n",
-      "\r\n",
-      "[RWKV.Trainer] Applying 'target_batch_size' with the following:\r\n",
-      "   - target_batch_size:       256\r\n",
-      "   - num_nodes:               1\r\n",
-      "   - num_devices:             8\r\n",
-      "   - accumulate_grad_batches: 32\r\n",
-      "   - effective_batch_size:    256\r\n",
-      "\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Resolving data files:   0%|                             | 0/801 [00:00<?, ?it/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Resolving data files: 100%|████████████████| 801/801 [00:00<00:00, 19074.11it/s]\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Downloading and preparing dataset json/default to /actions-runner/.cache/huggingface/datasets/json/default-58afc98fff125d49/0.0.0/8bb11242116d547c741b2e8a1f18598ffdd40a1d4f2a2872c7a28b697434bc96...\r\n",
-      "\r",
-      "Downloading data files:   0%|                             | 0/1 [00:00<?, ?it/s]\r",
-      "Downloading data files: 100%|████████████████████| 1/1 [00:00<00:00, 100.56it/s]\r\n",
-      "\r",
-      "Extracting data files:   0%|                              | 0/1 [00:00<?, ?it/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Extracting data files: 100%|██████████████████████| 1/1 [00:00<00:00,  3.99it/s]\r",
-      "Extracting data files: 100%|██████████████████████| 1/1 [00:00<00:00,  3.98it/s]\r\n",
-      "\r",
-      "Generating train split: 0 examples [00:00, ? examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Setting ds_accelerator to cuda (auto detect)\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Setting ds_accelerator to cuda (auto detect)\r\n",
-      "Setting ds_accelerator to cuda (auto detect)\r\n",
-      "Setting ds_accelerator to cuda (auto detect)\r\n",
-      "Setting ds_accelerator to cuda (auto detect)\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Setting ds_accelerator to cuda (auto detect)\r\n",
-      "Setting ds_accelerator to cuda (auto detect)\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[RWKV.model] Running RWKV model using 'torch-jit' with torch '2.0.1+cu118'\r\n",
-      "[RWKV.model] Running RWKV model using 'torch-jit' with torch '2.0.1+cu118'\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[RWKV.model] Running RWKV model using 'torch-jit' with torch '2.0.1+cu118'\r\n",
-      "[RWKV.model] Running RWKV model using 'torch-jit' with torch '2.0.1+cu118'\r\n",
-      "[RWKV.model] Running RWKV model using 'torch-jit' with torch '2.0.1+cu118'\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[RWKV.model] Running RWKV model using 'torch-jit' with torch '2.0.1+cu118'\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[RWKV.model] Running RWKV model using 'torch-jit' with torch '2.0.1+cu118'\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 1] Global seed set to 1802196061\r\n",
-      "[rank: 5] Global seed set to 1802196061\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 4] Global seed set to 1802196061\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 6] Global seed set to 1802196061\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 7] Global seed set to 1802196061\r\n",
-      "[rank: 2] Global seed set to 1802196061\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 3] Global seed set to 1802196061\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 1600 examples [00:13, 119.58 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 7600 examples [00:13, 750.27 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 15600 examples [00:13, 1913.83 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 23100 examples [00:13, 3407.90 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 29500 examples [00:13, 5133.71 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 35500 examples [00:13, 7188.01 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 42300 examples [00:14, 10295.27 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 51300 examples [00:14, 15767.82 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 58700 examples [00:14, 20491.01 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 65700 examples [00:14, 25373.13 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 73000 examples [00:14, 30932.20 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 79478 examples [00:14, 34292.07 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 86126 examples [00:14, 30595.62 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 91365 examples [00:15, 26486.88 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 95603 examples [00:15, 26430.42 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 100983 examples [00:15, 29972.00 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 105251 examples [00:15, 30714.67 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Generating train split: 109099 examples [00:15, 28324.37 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                                                                    \r"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Dataset json downloaded and prepared to /actions-runner/.cache/huggingface/datasets/json/default-58afc98fff125d49/0.0.0/8bb11242116d547c741b2e8a1f18598ffdd40a1d4f2a2872c7a28b697434bc96. Subsequent calls will reuse this data.\r\n",
-      "\r",
-      "  0%|                                                     | 0/1 [00:00<?, ?it/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "100%|█████████████████████████████████████████████| 1/1 [00:00<00:00, 29.99it/s]\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   0%|                      | 0/112050 [00:00<?, ? examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   0%|           | 38/112050 [00:02<1:47:16, 17.40 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   0%|            | 115/112050 [00:02<29:56, 62.30 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   0%|            | 166/112050 [00:02<21:41, 85.98 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   0%|           | 220/112050 [00:02<15:47, 118.05 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   0%|           | 269/112050 [00:02<12:29, 149.06 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   0%|           | 314/112050 [00:03<15:31, 119.98 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   0%|           | 521/112050 [00:03<05:59, 310.58 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   1%|           | 588/112050 [00:03<05:38, 329.75 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   1%|           | 719/112050 [00:03<04:01, 460.27 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   1%|           | 867/112050 [00:04<03:01, 613.96 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   1%|           | 959/112050 [00:04<03:21, 552.48 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   1%|          | 1042/112050 [00:04<04:45, 389.19 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   1%|          | 1210/112050 [00:04<03:27, 533.14 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   1%|          | 1319/112050 [00:04<02:58, 621.63 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   1%|▏         | 1406/112050 [00:05<03:06, 592.02 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   1%|▏         | 1482/112050 [00:05<03:32, 519.86 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   1%|▏         | 1605/112050 [00:05<02:57, 621.40 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   2%|▏         | 1686/112050 [00:05<03:22, 544.20 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   2%|▏         | 1858/112050 [00:05<02:47, 657.62 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   2%|▏         | 1958/112050 [00:05<02:58, 617.54 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   2%|▏         | 2072/112050 [00:06<02:43, 671.43 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   2%|▏         | 2248/112050 [00:06<02:13, 824.43 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   2%|▏         | 2364/112050 [00:06<02:14, 812.93 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   2%|▏         | 2450/112050 [00:06<02:33, 711.71 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   2%|▏         | 2525/112050 [00:06<02:52, 633.43 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   2%|▏         | 2641/112050 [00:06<03:04, 594.08 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   2%|▏         | 2781/112050 [00:07<03:31, 516.76 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   3%|▎         | 3151/112050 [00:07<02:27, 740.29 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   3%|▎         | 3352/112050 [00:07<02:01, 895.43 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   3%|▎         | 3454/112050 [00:07<02:22, 763.61 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   3%|▎         | 3570/112050 [00:08<02:49, 641.24 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   3%|▎         | 3794/112050 [00:08<02:02, 885.35 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   3%|▎         | 3914/112050 [00:08<02:01, 892.88 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   4%|▎         | 4026/112050 [00:08<02:33, 701.62 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   4%|▎        | 4369/112050 [00:08<01:32, 1170.41 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   4%|▎        | 4539/112050 [00:08<01:25, 1264.23 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   4%|▍         | 4705/112050 [00:09<01:58, 907.64 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   5%|▍        | 5118/112050 [00:09<01:28, 1203.55 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   5%|▍        | 5401/112050 [00:09<01:23, 1278.25 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   5%|▍        | 5769/112050 [00:09<01:15, 1402.45 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   5%|▍        | 6105/112050 [00:10<01:01, 1724.73 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   6%|▌        | 6318/112050 [00:10<01:11, 1479.24 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   6%|▌        | 6578/112050 [00:10<01:02, 1682.61 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   6%|▌        | 6778/112050 [00:10<01:14, 1410.80 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   6%|▌        | 7055/112050 [00:10<01:10, 1495.64 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   7%|▌        | 7456/112050 [00:10<01:05, 1594.57 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   7%|▌        | 7691/112050 [00:11<01:28, 1179.40 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   7%|▋        | 8315/112050 [00:11<01:03, 1638.74 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   8%|▋        | 8496/112050 [00:11<01:11, 1441.73 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   8%|▋        | 8657/112050 [00:11<01:27, 1181.60 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   8%|▋        | 9188/112050 [00:12<00:56, 1812.56 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   8%|▊        | 9432/112050 [00:12<01:05, 1558.91 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   9%|▊         | 9633/112050 [00:12<01:45, 968.05 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   9%|▋       | 10088/112050 [00:13<01:25, 1199.25 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):   9%|▋       | 10434/112050 [00:13<01:21, 1248.50 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  10%|▊       | 10801/112050 [00:13<01:04, 1561.99 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  10%|▊       | 11013/112050 [00:13<01:16, 1312.70 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  10%|▊       | 11186/112050 [00:13<01:16, 1313.82 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  10%|▊       | 11451/112050 [00:13<01:16, 1319.68 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  10%|▊       | 11764/112050 [00:14<01:02, 1607.40 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  11%|▊       | 11998/112050 [00:14<01:22, 1215.50 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  11%|▉       | 12315/112050 [00:14<01:06, 1503.21 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  11%|▉       | 12642/112050 [00:14<01:06, 1503.21 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  12%|▉       | 13079/112050 [00:14<00:50, 1969.95 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  12%|▉       | 13327/112050 [00:15<01:18, 1250.28 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  12%|▉       | 13669/112050 [00:15<01:10, 1400.96 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  12%|▉       | 13906/112050 [00:15<01:04, 1521.21 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  13%|█       | 14182/112050 [00:15<01:05, 1486.01 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  13%|█       | 14406/112050 [00:16<01:21, 1198.74 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  13%|█       | 14555/112050 [00:16<01:18, 1244.04 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  13%|█       | 14706/112050 [00:16<01:23, 1168.33 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  14%|█       | 15265/112050 [00:16<00:50, 1915.63 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  14%|█       | 15713/112050 [00:16<00:54, 1766.17 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  14%|█▏      | 16131/112050 [00:16<00:43, 2191.07 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  15%|█▏      | 16406/112050 [00:17<01:08, 1394.07 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  15%|█▏      | 16803/112050 [00:17<00:56, 1674.73 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  15%|█▏      | 17035/112050 [00:17<00:55, 1710.05 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  16%|█▏      | 17376/112050 [00:17<00:46, 2025.56 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  16%|█▎      | 17630/112050 [00:17<00:54, 1744.02 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  16%|█▎      | 18127/112050 [00:17<00:40, 2335.02 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  16%|█▎      | 18460/112050 [00:18<00:36, 2549.18 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  17%|█▎      | 18919/112050 [00:18<00:39, 2374.72 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  17%|█▍      | 19368/112050 [00:18<00:33, 2779.69 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  18%|█▍      | 19692/112050 [00:18<00:33, 2749.85 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  18%|█▍      | 20298/112050 [00:18<00:25, 3532.02 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  18%|█▍      | 20696/112050 [00:18<00:25, 3542.10 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  19%|█▌      | 21293/112050 [00:18<00:21, 4171.55 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  19%|█▌      | 21740/112050 [00:18<00:22, 4038.99 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  20%|█▌      | 22197/112050 [00:19<00:22, 3940.95 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  20%|█▌      | 22612/112050 [00:19<00:31, 2825.67 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  20%|█▋      | 22953/112050 [00:19<00:34, 2613.29 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  21%|█▋      | 23481/112050 [00:19<00:29, 2976.30 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  21%|█▋      | 23863/112050 [00:19<00:28, 3108.22 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  22%|█▋      | 24410/112050 [00:19<00:25, 3401.51 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  22%|█▊      | 24773/112050 [00:19<00:26, 3236.02 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  22%|█▊      | 25109/112050 [00:20<00:30, 2836.95 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  23%|█▊      | 25521/112050 [00:20<00:28, 3075.85 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  23%|█▊      | 25904/112050 [00:20<00:27, 3147.46 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  23%|█▉      | 26286/112050 [00:20<00:25, 3316.31 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  24%|█▉      | 26742/112050 [00:20<00:23, 3645.14 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  24%|█▉      | 27225/112050 [00:20<00:21, 3914.19 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  25%|█▉      | 27836/112050 [00:20<00:18, 4476.36 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  25%|██      | 28300/112050 [00:20<00:20, 4167.08 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  26%|██      | 28727/112050 [00:21<00:25, 3240.64 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  26%|██      | 29088/112050 [00:21<00:27, 3069.81 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  26%|██      | 29420/112050 [00:21<00:28, 2882.05 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  27%|██      | 29728/112050 [00:21<00:29, 2778.99 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  27%|██▏     | 30021/112050 [00:21<00:29, 2808.01 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  27%|██▏     | 30386/112050 [00:21<00:28, 2833.54 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  27%|██▏     | 30791/112050 [00:21<00:26, 3114.88 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  28%|██▏     | 31111/112050 [00:21<00:25, 3128.36 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  28%|██▏     | 31442/112050 [00:22<00:25, 3174.98 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  28%|██▎     | 31897/112050 [00:22<00:22, 3540.47 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  29%|██▎     | 32268/112050 [00:22<00:22, 3473.50 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  29%|██▎     | 32621/112050 [00:22<00:25, 3129.70 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  29%|██▎     | 32945/112050 [00:22<00:25, 3051.40 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  30%|██▎     | 33257/112050 [00:22<00:28, 2775.42 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  30%|██▍     | 33543/112050 [00:22<00:28, 2716.81 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  30%|██▍     | 33820/112050 [00:22<00:31, 2501.84 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  31%|██▍     | 34215/112050 [00:22<00:27, 2860.19 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  31%|██▍     | 34511/112050 [00:23<00:28, 2693.96 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  31%|██▍     | 34788/112050 [00:23<00:29, 2624.76 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  31%|██▌     | 35120/112050 [00:23<00:28, 2653.03 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  32%|██▌     | 35463/112050 [00:23<00:27, 2801.69 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  32%|██▌     | 35840/112050 [00:23<00:25, 3031.73 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  32%|██▌     | 36154/112050 [00:23<00:33, 2234.04 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  32%|██▌     | 36412/112050 [00:23<00:33, 2254.00 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  33%|██▌     | 36661/112050 [00:24<00:40, 1859.16 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  33%|██▋     | 36872/112050 [00:24<00:40, 1876.88 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  33%|██▋     | 37399/112050 [00:24<00:28, 2593.69 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  34%|██▋     | 37686/112050 [00:24<00:31, 2363.37 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  34%|██▋     | 37944/112050 [00:24<00:34, 2162.59 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  34%|██▋     | 38177/112050 [00:24<00:35, 2084.50 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  34%|██▋     | 38425/112050 [00:24<00:33, 2173.80 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  34%|██▊     | 38655/112050 [00:24<00:33, 2204.43 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  35%|██▊     | 38883/112050 [00:25<00:52, 1403.10 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  35%|██▊     | 39190/112050 [00:25<00:57, 1263.03 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  35%|██▊     | 39454/112050 [00:25<00:50, 1435.19 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  35%|██▊     | 39678/112050 [00:25<00:48, 1480.79 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  36%|██▊     | 39852/112050 [00:26<00:55, 1295.62 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  36%|██▊     | 40156/112050 [00:26<00:43, 1634.88 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  36%|██▉     | 40386/112050 [00:26<00:41, 1714.18 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  36%|██▉     | 40695/112050 [00:26<00:35, 2022.29 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  37%|██▉     | 40923/112050 [00:26<00:36, 1924.05 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  37%|██▉     | 41134/112050 [00:26<00:39, 1808.59 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  37%|██▉     | 41331/112050 [00:26<00:38, 1832.59 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  37%|██▉     | 41524/112050 [00:26<00:38, 1844.49 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  37%|██▉     | 41755/112050 [00:26<00:35, 1968.28 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  37%|██▉     | 41959/112050 [00:27<00:35, 1958.67 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  38%|███     | 42185/112050 [00:27<00:34, 2008.13 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  38%|███     | 42422/112050 [00:27<00:33, 2069.35 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  38%|███     | 42661/112050 [00:27<00:32, 2157.30 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  38%|███     | 42881/112050 [00:27<00:32, 2124.46 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  38%|███     | 43095/112050 [00:27<00:33, 2046.76 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  39%|███     | 43302/112050 [00:27<00:34, 1995.31 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  39%|███     | 43503/112050 [00:27<00:40, 1675.07 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  39%|███     | 43680/112050 [00:28<00:50, 1365.30 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  39%|███▏    | 44088/112050 [00:28<00:34, 1948.49 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  40%|███▏    | 44387/112050 [00:28<00:30, 2198.65 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  40%|███▏    | 44635/112050 [00:28<00:34, 1977.62 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  40%|███▏    | 44885/112050 [00:28<00:31, 2099.29 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  40%|███▏    | 45113/112050 [00:28<00:31, 2105.45 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  40%|███▏    | 45340/112050 [00:28<00:32, 2083.87 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  41%|███▎    | 45560/112050 [00:28<00:32, 2029.00 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  41%|███▎    | 45769/112050 [00:28<00:33, 2004.36 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  41%|███▎    | 46013/112050 [00:29<00:31, 2121.03 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  41%|███▎    | 46231/112050 [00:29<00:30, 2133.43 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  41%|███▎    | 46478/112050 [00:29<00:29, 2196.53 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  42%|███▎    | 46700/112050 [00:29<00:46, 1398.98 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  42%|███▎    | 46878/112050 [00:29<00:48, 1339.61 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  42%|███▎    | 47256/112050 [00:29<00:35, 1812.18 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  42%|███▍    | 47470/112050 [00:29<00:35, 1795.22 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  43%|███▍    | 47675/112050 [00:30<00:38, 1681.85 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  43%|███▍    | 47861/112050 [00:30<00:40, 1602.96 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  43%|███▍    | 48036/112050 [00:30<00:41, 1546.88 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  43%|███▍    | 48201/112050 [00:30<00:41, 1548.70 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  43%|███▍    | 48362/112050 [00:30<00:41, 1516.69 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  43%|███▍    | 48519/112050 [00:30<00:41, 1514.92 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  43%|███▍    | 48683/112050 [00:30<00:40, 1547.69 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  44%|███▍    | 48846/112050 [00:30<00:40, 1570.48 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  44%|███▍    | 49005/112050 [00:30<00:42, 1479.88 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  44%|███▌    | 49194/112050 [00:31<00:39, 1577.02 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  44%|███▌    | 49391/112050 [00:31<00:37, 1656.84 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  44%|███▌    | 49588/112050 [00:31<00:36, 1733.45 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  44%|███▌    | 49791/112050 [00:31<00:34, 1815.19 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  45%|███▌    | 49976/112050 [00:31<00:36, 1715.92 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  45%|███▌    | 50211/112050 [00:31<00:33, 1858.45 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  45%|███▌    | 50408/112050 [00:31<00:33, 1840.60 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  45%|███▌    | 50595/112050 [00:31<00:33, 1839.34 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  45%|███▋    | 50808/112050 [00:31<00:32, 1895.99 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  46%|███▋    | 51033/112050 [00:32<00:30, 1997.09 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  46%|███▋    | 51259/112050 [00:32<00:29, 2071.97 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  46%|███▋    | 51521/112050 [00:32<00:27, 2203.35 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  46%|███▋    | 51743/112050 [00:32<00:28, 2126.73 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  46%|███▋    | 51961/112050 [00:32<00:28, 2112.66 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  47%|███▋    | 52174/112050 [00:32<00:32, 1864.39 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  47%|███▋    | 52368/112050 [00:32<00:34, 1743.16 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  47%|███▊    | 52547/112050 [00:32<00:35, 1657.54 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  47%|███▊    | 52716/112050 [00:32<00:38, 1546.89 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  47%|███▊    | 52899/112050 [00:33<00:36, 1615.32 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  47%|███▊    | 53100/112050 [00:33<00:34, 1720.65 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  48%|███▊    | 53345/112050 [00:33<00:30, 1913.81 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  48%|███▊    | 53571/112050 [00:33<00:29, 2001.96 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  48%|███▊    | 53850/112050 [00:33<00:26, 2207.94 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  48%|███▊    | 54141/112050 [00:33<00:24, 2358.65 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  49%|███▉    | 54479/112050 [00:33<00:21, 2622.78 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  49%|███▉    | 54875/112050 [00:33<00:19, 2983.19 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  49%|███▉    | 55180/112050 [00:33<00:19, 2982.56 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  50%|███▉    | 55481/112050 [00:34<00:20, 2759.33 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  50%|███▉    | 55770/112050 [00:34<00:21, 2639.20 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  50%|████    | 56038/112050 [00:34<00:25, 2237.03 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  50%|████    | 56274/112050 [00:34<00:24, 2258.40 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  50%|████    | 56509/112050 [00:34<00:25, 2218.53 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  51%|████    | 56737/112050 [00:34<00:25, 2187.42 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  51%|████    | 57055/112050 [00:34<00:22, 2403.63 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  51%|████    | 57325/112050 [00:34<00:22, 2483.81 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  51%|████    | 57578/112050 [00:34<00:22, 2375.80 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  52%|████▏   | 57886/112050 [00:35<00:21, 2564.12 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  52%|████▏   | 58204/112050 [00:35<00:20, 2672.42 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  52%|████▏   | 58477/112050 [00:35<00:20, 2603.34 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  52%|████▏   | 58745/112050 [00:35<00:20, 2554.74 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  53%|████▏   | 59004/112050 [00:35<00:22, 2343.45 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  53%|████▏   | 59251/112050 [00:35<00:22, 2346.86 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  53%|████▏   | 59490/112050 [00:35<00:28, 1817.70 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  53%|████▎   | 59692/112050 [00:35<00:28, 1829.70 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  53%|████▎   | 59889/112050 [00:36<00:31, 1664.02 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  54%|████▎   | 60068/112050 [00:36<00:34, 1495.75 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  54%|████▎   | 60227/112050 [00:36<00:34, 1492.10 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  54%|████▎   | 60385/112050 [00:36<00:34, 1501.40 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  54%|████▎   | 60555/112050 [00:36<00:46, 1098.86 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  54%|████▎   | 61054/112050 [00:36<00:26, 1900.02 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  55%|████▍   | 61292/112050 [00:36<00:27, 1865.85 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  55%|████▍   | 61513/112050 [00:37<00:27, 1852.47 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  55%|███���▍   | 61722/112050 [00:37<00:26, 1865.24 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  55%|████▍   | 61932/112050 [00:37<00:26, 1911.63 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  55%|████▍   | 62138/112050 [00:37<00:27, 1815.45 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  56%|████▍   | 62336/112050 [00:37<00:26, 1856.92 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  56%|████▍   | 62539/112050 [00:37<00:30, 1620.65 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  56%|████▍   | 62863/112050 [00:37<00:24, 2013.11 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  56%|████▌   | 63094/112050 [00:37<00:23, 2089.75 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  57%|████▌   | 63336/112050 [00:38<00:22, 2171.87 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  57%|████▌   | 63636/112050 [00:38<00:20, 2380.95 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  57%|████▌   | 63890/112050 [00:38<00:20, 2387.04 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  57%|████▌   | 64137/112050 [00:38<00:23, 2067.97 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  57%|████▌   | 64357/112050 [00:38<00:25, 1890.50 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  58%|████▌   | 64556/112050 [00:38<00:26, 1788.01 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  58%|████▌   | 64743/112050 [00:38<00:28, 1664.42 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  58%|████▋   | 64915/112050 [00:38<00:28, 1676.36 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  58%|████▋   | 65087/112050 [00:38<00:28, 1672.70 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  58%|████▋   | 65273/112050 [00:39<00:27, 1720.90 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  58%|████▋   | 65449/112050 [00:39<00:26, 1729.35 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  59%|████▋   | 65625/112050 [00:39<00:38, 1217.41 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  59%|████▋   | 65846/112050 [00:39<00:32, 1415.94 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  59%|████▋   | 66081/112050 [00:39<00:28, 1635.99 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  59%|████▋   | 66265/112050 [00:39<00:35, 1303.10 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  59%|████▊   | 66533/112050 [00:39<00:28, 1569.87 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  60%|████▊   | 66748/112050 [00:40<00:27, 1658.29 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  60%|████▊   | 66978/112050 [00:40<00:24, 1814.00 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  60%|████▊   | 67178/112050 [00:40<00:24, 1832.13 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  60%|████▊   | 67374/112050 [00:40<00:23, 1862.14 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  60%|████▊   | 67639/112050 [00:40<00:22, 1990.56 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  61%|████▊   | 67845/112050 [00:40<00:22, 1984.10 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  61%|████▊   | 68049/112050 [00:40<00:23, 1842.04 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  61%|████▉   | 68292/112050 [00:40<00:21, 1998.41 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  61%|████▉   | 68497/112050 [00:40<00:24, 1788.31 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  61%|████▉   | 68685/112050 [00:41<00:24, 1753.90 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  61%|████▉   | 68868/112050 [00:41<00:25, 1713.67 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  62%|████▉   | 69043/112050 [00:41<00:31, 1350.14 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  62%|████▉   | 69191/112050 [00:41<00:32, 1322.70 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  62%|████▉   | 69333/112050 [00:41<00:37, 1140.56 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  62%|████▉   | 69457/112050 [00:41<00:40, 1064.23 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  62%|████▉   | 69570/112050 [00:41<00:41, 1017.76 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  62%|█████▌   | 69676/112050 [00:42<00:42, 995.38 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  62%|█████▌   | 69780/112050 [00:42<00:49, 848.68 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  62%|█████▌   | 69882/112050 [00:42<00:47, 887.13 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  62%|█████▌   | 69978/112050 [00:42<00:47, 892.97 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  63%|█████▋   | 70090/112050 [00:42<00:44, 949.59 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  63%|█████▋   | 70203/112050 [00:42<00:42, 994.02 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  63%|█████   | 70342/112050 [00:42<00:37, 1101.08 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  63%|█████   | 70471/112050 [00:42<00:36, 1129.92 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  63%|█████   | 70608/112050 [00:42<00:34, 1190.91 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  63%|█████   | 70747/112050 [00:43<00:34, 1203.54 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  63%|█████   | 70870/112050 [00:43<00:35, 1161.81 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  63%|█████   | 71008/112050 [00:43<00:33, 1222.38 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  63%|█████   | 71132/112050 [00:43<00:36, 1130.64 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  64%|█████   | 71305/112050 [00:43<00:31, 1288.08 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  64%|█████   | 71445/112050 [00:43<00:31, 1276.66 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  64%|█████   | 71610/112050 [00:43<00:30, 1333.21 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  64%|█████   | 71757/112050 [00:43<00:29, 1370.17 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  64%|█████▏  | 71969/112050 [00:43<00:25, 1572.06 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  64%|█████▏  | 72167/112050 [00:44<00:23, 1680.88 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  65%|█████▏  | 72343/112050 [00:44<00:23, 1690.59 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  65%|█████▏  | 72514/112050 [00:44<00:24, 1617.23 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  65%|█████▏  | 72679/112050 [00:44<00:24, 1599.96 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  65%|█████▏  | 72848/112050 [00:44<00:25, 1531.31 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  65%|█████▏  | 73005/112050 [00:44<00:25, 1530.29 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  65%|█████▏  | 73209/112050 [00:44<00:23, 1673.05 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  66%|█████▏  | 73398/112050 [00:44<00:22, 1697.78 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  66%|█████▎  | 73575/112050 [00:44<00:22, 1717.78 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  66%|█████▎  | 73760/112050 [00:45<00:21, 1745.36 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  66%|█████▎  | 73936/112050 [00:45<00:24, 1586.19 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  66%|█████▎  | 74114/112050 [00:45<00:23, 1586.53 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  66%|█████▎  | 74275/112050 [00:45<00:24, 1520.33 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  66%|█████▎  | 74434/112050 [00:45<00:24, 1527.97 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  67%|█████▎  | 74589/112050 [00:45<00:26, 1419.33 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  67%|█████▎  | 74734/112050 [00:45<00:26, 1423.24 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  67%|█████▎  | 74878/112050 [00:45<00:26, 1407.27 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  67%|█���███▎  | 75021/112050 [00:45<00:26, 1408.03 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  67%|█████▎  | 75174/112050 [00:46<00:25, 1442.63 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  67%|█████▍  | 75320/112050 [00:46<00:25, 1435.54 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  67%|█████▍  | 75476/112050 [00:46<00:25, 1424.40 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  67%|█████▍  | 75619/112050 [00:46<00:26, 1350.62 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  68%|█████▍  | 75768/112050 [00:46<00:26, 1386.91 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  68%|█████▍  | 76014/112050 [00:46<00:21, 1692.06 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  68%|█████▍  | 76239/112050 [00:46<00:19, 1833.88 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  68%|█████▍  | 76439/112050 [00:46<00:18, 1874.89 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  68%|█████▍  | 76629/112050 [00:46<00:19, 1793.92 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  69%|█████▍  | 76811/112050 [00:47<00:22, 1577.36 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  69%|█████▍  | 76978/112050 [00:47<00:21, 1596.38 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  69%|█████▌  | 77143/112050 [00:47<00:21, 1589.09 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  69%|█████▌  | 77336/112050 [00:47<00:20, 1680.23 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  69%|█████▌  | 77510/112050 [00:47<00:20, 1683.44 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  69%|█████▌  | 77690/112050 [00:47<00:20, 1709.25 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  69%|█████▌  | 77864/112050 [00:47<00:22, 1533.63 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  70%|█████▌  | 78054/112050 [00:47<00:20, 1625.42 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  70%|█████▌  | 78221/112050 [00:47<00:21, 1592.54 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  70%|█████▌  | 78383/112050 [00:48<00:23, 1458.77 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  70%|█████▌  | 78543/112050 [00:48<00:22, 1492.04 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  70%|█████▌  | 78696/112050 [00:48<00:25, 1327.09 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  70%|█████▋  | 78834/112050 [00:48<00:24, 1336.62 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  70%|█████▋  | 78972/112050 [00:48<00:24, 1340.81 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  71%|█████▋  | 79110/112050 [00:48<00:24, 1348.09 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  71%|█████▋  | 79253/112050 [00:48<00:24, 1345.21 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  71%|█████▋  | 79399/112050 [00:48<00:23, 1365.56 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  71%|█████▋  | 79552/112050 [00:48<00:23, 1391.45 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  71%|█████▋  | 79692/112050 [00:49<00:25, 1286.97 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  71%|█████▋  | 79826/112050 [00:49<00:26, 1215.15 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  71%|█████▋  | 79980/112050 [00:49<00:24, 1288.43 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  71%|█████▋  | 80114/112050 [00:49<00:24, 1282.15 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  72%|█████▋  | 80244/112050 [00:49<00:24, 1275.26 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  72%|█████▋  | 80398/112050 [00:49<00:24, 1294.03 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  72%|█████▊  | 80550/112050 [00:49<00:23, 1350.83 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  72%|█████▊  | 80688/112050 [00:49<00:23, 1346.16 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  72%|█████▊  | 80859/112050 [00:49<00:21, 1447.59 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  72%|█████▊  | 81050/112050 [00:50<00:19, 1565.48 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  73%|█████▊  | 81247/112050 [00:50<00:23, 1302.92 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  73%|█████▊  | 81518/112050 [00:50<00:18, 1638.31 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  73%|█████▊  | 81696/112050 [00:50<00:21, 1421.15 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  73%|█████▊  | 81852/112050 [00:50<00:21, 1411.07 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  73%|█████▊  | 82004/112050 [00:50<00:23, 1292.24 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  73%|█████▊  | 82141/112050 [00:50<00:24, 1224.11 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  73%|█████▊  | 82269/112050 [00:50<00:24, 1216.27 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  74%|█████▉  | 82429/112050 [00:51<00:23, 1287.39 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  74%|█████▉  | 82564/112050 [00:51<00:22, 1298.20 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  74%|█████▉  | 82738/112050 [00:51<00:20, 1410.25 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  74%|█████▉  | 82882/112050 [00:51<00:22, 1297.51 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  74%|█████▉  | 83079/112050 [00:51<00:19, 1450.91 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  74%|█████▉  | 83238/112050 [00:51<00:19, 1464.62 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  74%|█████▉  | 83387/112050 [00:51<00:19, 1439.51 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  75%|█████▉  | 83543/112050 [00:51<00:19, 1454.58 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  75%|█████▉  | 83690/112050 [00:51<00:20, 1389.97 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  75%|█████▉  | 83857/112050 [00:52<00:27, 1023.04 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  75%|█████▉  | 83998/112050 [00:52<00:26, 1071.10 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  75%|██████  | 84174/112050 [00:52<00:22, 1229.42 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  75%|██████  | 84387/112050 [00:52<00:19, 1424.99 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  75%|██████  | 84569/112050 [00:52<00:18, 1524.18 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  76%|██████  | 84735/112050 [00:52<00:18, 1461.73 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  76%|██████  | 84889/112050 [00:52<00:24, 1114.41 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  76%|██████  | 85051/112050 [00:53<00:22, 1213.64 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  76%|██████  | 85189/112050 [00:53<00:26, 1002.49 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  76%|██████▊  | 85305/112050 [00:53<00:27, 975.53 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  76%|██████  | 85417/112050 [00:53<00:26, 1007.52 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  76%|██████▊  | 85526/112050 [00:53<00:26, 985.76 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  76%|██████  | 85674/112050 [00:53<00:23, 1106.43 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  77%|██████▏ | 85832/112050 [00:53<00:21, 1226.34 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  77%|██████▏ | 85962/112050 [00:53<00:22, 1175.93 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  77%|██████▏ | 86104/112050 [00:54<00:20, 1240.43 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  77%|██████▏ | 86262/112050 [00:54<00:19, 1332.12 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  77%|██████▏ | 86401/112050 [00:54<00:19, 1342.05 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  77%|██████▏ | 86584/112050 [00:54<00:17, 1468.26 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  77%|██████▏ | 86801/112050 [00:54<00:15, 1664.31 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  78%|██████▏ | 86972/112050 [00:54<00:16, 1486.33 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  78%|██████▏ | 87126/112050 [00:54<00:17, 1444.29 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  78%|███████  | 87276/112050 [00:55<00:26, 941.70 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  78%|██████▎ | 87638/112050 [00:55<00:16, 1455.05 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  78%|██████▎ | 87827/112050 [00:55<00:15, 1518.59 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  79%|███████  | 88008/112050 [00:55<00:34, 696.52 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  79%|███████  | 88153/112050 [00:56<00:30, 779.09 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  79%|███████  | 88288/112050 [00:56<00:28, 846.64 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  79%|██████▎ | 88467/112050 [00:56<00:23, 1012.14 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  79%|██████▎ | 88614/112050 [00:56<00:21, 1103.18 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  79%|██████▎ | 88768/112050 [00:56<00:19, 1181.57 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  79%|██████▎ | 88913/112050 [00:56<00:19, 1175.10 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  79%|██████▎ | 89055/112050 [00:56<00:18, 1232.79 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  80%|██████▎ | 89193/112050 [00:56<00:18, 1226.87 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  80%|██████▍ | 89326/112050 [00:56<00:18, 1209.35 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  80%|██████▍ | 89461/112050 [00:56<00:18, 1241.71 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  80%|██████▍ | 89591/112050 [00:57<00:18, 1207.37 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  80%|██████▍ | 89721/112050 [00:57<00:18, 1210.77 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  80%|██████▍ | 89864/112050 [00:57<00:17, 1270.47 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  80%|██████▍ | 89995/112050 [00:57<00:18, 1183.08 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  80%|██████▍ | 90156/112050 [00:57<00:17, 1277.45 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  81%|██████▍ | 90287/112050 [00:57<00:17, 1219.04 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  81%|██████▍ | 90414/112050 [00:57<00:18, 1188.97 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  81%|██████▍ | 90537/112050 [00:57<00:17, 1195.81 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  81%|██████▍ | 90664/112050 [00:58<00:19, 1086.26 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  81%|██████▍ | 90826/112050 [00:58<00:17, 1224.87 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  81%|██████▍ | 90953/112050 [00:58<00:17, 1190.34 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  81%|██████▌ | 91080/112050 [00:58<00:18, 1110.94 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  81%|███████▎ | 91195/112050 [00:58<00:25, 822.95 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  81%|███████▎ | 91290/112050 [00:59<00:44, 462.22 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  82%|███████▎ | 91453/112050 [00:59<00:32, 629.07 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  82%|███████▎ | 91556/112050 [00:59<00:29, 696.27 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  82%|███████▎ | 91664/112050 [00:59<00:28, 724.50 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  82%|███████▎ | 91761/112050 [00:59<00:26, 771.36 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  82%|███████▍ | 91856/112050 [00:59<00:24, 810.46 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  82%|███████▍ | 91956/112050 [00:59<00:23, 844.49 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  82%|███████▍ | 92061/112050 [00:59<00:22, 884.74 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  82%|███████▍ | 92165/112050 [00:59<00:21, 908.89 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  82%|███████▍ | 92263/112050 [01:00<00:22, 897.81 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  82%|███████▍ | 92358/112050 [01:00<00:21, 911.42 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  83%|███████▍ | 92456/112050 [01:00<00:21, 925.08 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  83%|███████▍ | 92572/112050 [01:00<00:19, 990.09 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  83%|██████▌ | 92698/112050 [01:00<00:18, 1060.43 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  83%|██████▋ | 92807/112050 [01:00<00:18, 1057.08 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  83%|██████▋ | 92936/112050 [01:00<00:17, 1101.09 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  83%|██████▋ | 93094/112050 [01:00<00:15, 1226.39 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  83%|███████▍ | 93219/112050 [01:00<00:18, 995.22 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  83%|██████▋ | 93430/112050 [01:01<00:14, 1269.67 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  84%|██████▋ | 93570/112050 [01:01<00:16, 1096.67 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  84%|██████▋ | 93694/112050 [01:01<00:16, 1129.54 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  84%|███████▌ | 93817/112050 [01:01<00:18, 973.69 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  84%|██████▋ | 93959/112050 [01:01<00:17, 1063.76 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  84%|██████▋ | 94079/112050 [01:01<00:16, 1097.54 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  84%|██████▋ | 94240/112050 [01:01<00:15, 1185.87 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  84%|██████▋ | 94389/112050 [01:01<00:13, 1265.45 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  84%|██████▋ | 94520/112050 [01:02<00:14, 1184.60 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  84%|██████▊ | 94645/112050 [01:02<00:16, 1044.69 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  85%|███████▌ | 94755/112050 [01:02<00:18, 944.43 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  85%|███████▌ | 94856/112050 [01:02<00:19, 892.60 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  85%|███████▋ | 94950/112050 [01:02<00:20, 829.25 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  85%|███████▋ | 95036/112050 [01:02<00:21, 777.36 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  85%|███████▋ | 95117/112050 [01:02<00:23, 731.05 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  85%|███████▋ | 95195/112050 [01:03<00:22, 738.26 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  85%|███████▋ | 95271/112050 [01:03<00:36, 459.61 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  85%|███████▋ | 95348/112050 [01:03<00:32, 515.54 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  85%|███████▋ | 95413/112050 [01:03<00:31, 535.79 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  85%|███████▋ | 95492/112050 [01:03<00:27, 593.29 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  85%|███████▋ | 95560/112050 [01:03<00:28, 578.05 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  85%|███████▋ | 95661/112050 [01:03<00:24, 664.97 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  85%|███████▋ | 95734/112050 [01:04<00:23, 680.80 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  86%|███████▋ | 95807/112050 [01:04<00:27, 587.26 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  86%|███████▋ | 95957/112050 [01:04<00:19, 809.69 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  86%|███████▋ | 96050/112050 [01:04<00:19, 837.65 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  86%|███████▋ | 96153/112050 [01:04<00:18, 856.31 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  86%|███████▋ | 96259/112050 [01:04<00:17, 901.68 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  86%|███████▋ | 96353/112050 [01:04<00:17, 908.04 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  86%|███████▋ | 96462/112050 [01:04<00:17, 912.48 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  86%|███████▊ | 96573/112050 [01:04<00:16, 961.76 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  86%|███████▊ | 96675/112050 [01:05<00:15, 961.62 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  86%|███████▊ | 96774/112050 [01:05<00:21, 718.10 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  86%|███████▊ | 96883/112050 [01:05<00:18, 803.78 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  87%|███████▊ | 96985/112050 [01:05<00:17, 857.29 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  87%|███████▊ | 97079/112050 [01:05<00:19, 772.18 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  87%|███████▊ | 97164/112050 [01:05<00:20, 742.96 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  87%|███████▊ | 97243/112050 [01:05<00:20, 709.84 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  87%|███████▊ | 97318/112050 [01:06<00:23, 631.10 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  87%|███████▊ | 97387/112050 [01:06<00:23, 614.75 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  87%|███████▊ | 97469/112050 [01:06<00:22, 651.18 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  87%|███████▊ | 97537/112050 [01:06<00:22, 633.42 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  87%|███████▊ | 97638/112050 [01:06<00:19, 729.92 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  87%|███████▊ | 97721/112050 [01:06<00:19, 742.09 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  87%|███████▊ | 97800/112050 [01:06<00:18, 751.78 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  87%|███████▊ | 97886/112050 [01:06<00:18, 777.51 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  87%|███████▊ | 97985/112050 [01:06<00:17, 813.27 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  88%|███████▉ | 98093/112050 [01:06<00:15, 879.09 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  88%|███████▉ | 98184/112050 [01:07<00:15, 882.66 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  88%|███████▉ | 98273/112050 [01:07<00:16, 854.40 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  88%|███████▉ | 98361/112050 [01:07<00:16, 853.75 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  88%|███████▉ | 98449/112050 [01:07<00:18, 741.64 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  88%|███████▉ | 98566/112050 [01:07<00:15, 846.01 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  88%|███████▉ | 98654/112050 [01:07<00:16, 795.35 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  88%|███████▉ | 98737/112050 [01:07<00:17, 741.18 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  88%|███████▉ | 98814/112050 [01:07<00:18, 700.68 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  88%|███████▉ | 98896/112050 [01:08<00:18, 716.42 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  88%|███████▉ | 98999/112050 [01:08<00:20, 632.08 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  88%|███████▉ | 99128/112050 [01:08<00:16, 776.80 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  89%|███████▉ | 99212/112050 [01:08<00:17, 736.51 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  89%|███████▉ | 99292/112050 [01:08<00:18, 705.99 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  89%|███████▉ | 99366/112050 [01:08<00:17, 707.02 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  89%|███████▉ | 99440/112050 [01:08<00:17, 708.79 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  89%|███████▉ | 99521/112050 [01:08<00:17, 735.90 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  89%|███████▉ | 99597/112050 [01:09<00:20, 601.12 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  89%|████████ | 99674/112050 [01:09<00:19, 626.61 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  89%|████████ | 99758/112050 [01:09<00:18, 668.10 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  89%|████████ | 99854/112050 [01:09<00:16, 743.40 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  89%|████████ | 99957/112050 [01:09<00:15, 792.18 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  89%|███████▏| 100068/112050 [01:09<00:13, 875.74 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  89%|███████▏| 100158/112050 [01:09<00:13, 855.11 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  89%|███████▏| 100255/112050 [01:09<00:14, 839.29 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  90%|███████▏| 100344/112050 [01:09<00:13, 838.04 examples/s][rank: 3] Global seed set to 1802196061\r\n",
-      "initializing deepspeed distributed: GLOBAL_RANK: 3, MEMBER: 4/8\r\n",
-      "[2023-09-01 02:58:16,732] [WARNING] [comm.py:152:init_deepspeed_backend] NCCL backend in DeepSpeed not yet implemented\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  90%|███████▏| 100431/112050 [01:10<00:14, 804.82 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  90%|███████▏| 100513/112050 [01:10<00:15, 725.92 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  90%|███████▏| 100656/112050 [01:10<00:12, 901.63 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  90%|███████▏| 100750/112050 [01:10<00:13, 840.56 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  90%|███████▏| 100838/112050 [01:10<00:17, 631.52 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  90%|███████▏| 100941/112050 [01:10<00:15, 716.89 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  90%|███████▏| 101037/112050 [01:10<00:14, 771.54 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  90%|███████▏| 101164/112050 [01:11<00:12, 883.87 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  90%|███████▏| 101260/112050 [01:11<00:14, 763.41 examples/s][rank: 7] Global seed set to 1802196061\r\n",
-      "initializing deepspeed distributed: GLOBAL_RANK: 7, MEMBER: 8/8\r\n",
-      "[2023-09-01 02:58:17,943] [WARNING] [comm.py:152:init_deepspeed_backend] NCCL backend in DeepSpeed not yet implemented\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  90%|███████▏| 101347/112050 [01:11<00:14, 729.00 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  91%|███████▏| 101426/112050 [01:11<00:14, 737.11 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  91%|███████▏| 101508/112050 [01:11<00:15, 690.46 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  91%|███████▎| 101582/112050 [01:11<00:16, 620.28 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  91%|███████▎| 101647/112050 [01:11<00:18, 571.70 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  91%|███████▎| 101737/112050 [01:11<00:15, 647.36 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  91%|███████▎| 101810/112050 [01:12<00:16, 635.36 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  91%|███████▎| 101887/112050 [01:12<00:15, 657.72 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  91%|███████▎| 101956/112050 [01:12<00:15, 634.40 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  91%|███████▎| 102021/112050 [01:12<00:16, 616.34 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  91%|███████▎| 102085/112050 [01:12<00:19, 498.39 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  91%|███████▎| 102158/112050 [01:12<00:19, 517.12 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  91%|███████▎| 102241/112050 [01:12<00:16, 579.75 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  91%|███████▎| 102311/112050 [01:12<00:16, 607.65 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  91%|███████▎| 102376/112050 [01:13<00:16, 601.64 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  91%|███████▎| 102517/112050 [01:13<00:11, 807.55 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|███████▎| 102601/112050 [01:13<00:13, 681.79 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|███████▎| 102687/112050 [01:13<00:13, 718.82 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|███████▎| 102764/112050 [01:13<00:14, 636.71 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|███████▎| 102832/112050 [01:13<00:17, 531.88 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|███████▎| 102891/112050 [01:13<00:18, 496.61 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|███████▎| 102947/112050 [01:14<00:18, 504.18 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|███████▎| 103003/112050 [01:14<00:17, 517.10 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|███████▎| 103058/112050 [01:14<00:17, 510.19 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|███████▎| 103131/112050 [01:14<00:16, 550.79 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|███████▎| 103208/112050 [01:14<00:14, 607.68 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|███████▎| 103271/112050 [01:14<00:15, 550.12 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|███████▍| 103328/112050 [01:14<00:16, 544.53 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|███████▍| 103384/112050 [01:14<00:17, 501.83 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|███████▍| 103436/112050 [01:14<00:18, 467.76 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|███████▍| 103489/112050 [01:15<00:17, 477.87 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|███████▍| 103542/112050 [01:15<00:17, 481.04 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  92%|███████▍| 103604/112050 [01:15<00:16, 515.80 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|███████▍| 103682/112050 [01:15<00:14, 582.10 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|███████▍| 103742/112050 [01:15<00:14, 581.09 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|███████▍| 103804/112050 [01:15<00:14, 571.49 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|███████▍| 103863/112050 [01:15<00:14, 566.04 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|███████▍| 103930/112050 [01:15<00:13, 594.33 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|███████▍| 104005/112050 [01:15<00:12, 634.24 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|███████▍| 104071/112050 [01:16<00:12, 616.12 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|███████▍| 104157/112050 [01:16<00:11, 680.62 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|███████▍| 104228/112050 [01:16<00:12, 650.27 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|███████▍| 104295/112050 [01:16<00:13, 569.89 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|███████▍| 104361/112050 [01:16<00:12, 592.16 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|███████▍| 104423/112050 [01:16<00:14, 518.22 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|███████▍| 104478/112050 [01:16<00:16, 451.28 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|███████▍| 104565/112050 [01:16<00:13, 544.01 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|███████▍| 104635/112050 [01:17<00:13, 562.38 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|███████▍| 104698/112050 [01:17<00:12, 569.66 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  93%|███████▍| 104759/112050 [01:17<00:13, 527.05 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▍| 104814/112050 [01:17<00:15, 467.18 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▍| 104863/112050 [01:17<00:16, 443.98 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▍| 104913/112050 [01:17<00:15, 446.36 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▍| 104966/112050 [01:17<00:15, 465.64 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▍| 105015/112050 [01:17<00:14, 470.08 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▌| 105068/112050 [01:17<00:14, 480.63 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▌| 105134/112050 [01:18<00:16, 424.05 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▌| 105225/112050 [01:18<00:12, 539.46 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▌| 105284/112050 [01:18<00:14, 473.69 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▌| 105336/112050 [01:18<00:14, 454.26 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▌| 105386/112050 [01:18<00:15, 440.24 examples/s][rank: 4] Global seed set to 1802196061\r\n",
-      "initializing deepspeed distributed: GLOBAL_RANK: 4, MEMBER: 5/8\r\n",
-      "[2023-09-01 02:58:25,460] [WARNING] [comm.py:152:init_deepspeed_backend] NCCL backend in DeepSpeed not yet implemented\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▌| 105433/112050 [01:18<00:16, 413.35 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▌| 105486/112050 [01:18<00:14, 438.70 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▌| 105536/112050 [01:19<00:14, 446.04 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▌| 105582/112050 [01:19<00:15, 423.31 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▌| 105627/112050 [01:19<00:16, 398.66 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▌| 105671/112050 [01:19<00:16, 383.99 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▌| 105716/112050 [01:19<00:15, 396.72 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▌| 105772/112050 [01:19<00:14, 440.22 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▌| 105819/112050 [01:19<00:14, 441.59 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  94%|███████▌| 105880/112050 [01:19<00:12, 487.36 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▌| 105931/112050 [01:19<00:12, 488.04 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▌| 105984/112050 [01:20<00:12, 494.26 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▌| 106040/112050 [01:20<00:12, 497.54 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▌| 106098/112050 [01:20<00:11, 516.41 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▌| 106164/112050 [01:20<00:10, 554.95 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▌| 106220/112050 [01:20<00:10, 550.82 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▌| 106277/112050 [01:20<00:10, 531.87 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▌| 106331/112050 [01:20<00:11, 507.69 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▌| 106384/112050 [01:20<00:12, 437.38 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▌| 106430/112050 [01:20<00:12, 436.27 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▌| 106476/112050 [01:21<00:13, 418.15 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▌| 106520/112050 [01:21<00:14, 386.47 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▌| 106563/112050 [01:21<00:13, 395.69 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▌| 106604/112050 [01:21<00:14, 378.14 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▌| 106645/112050 [01:21<00:15, 358.31 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▌| 106694/112050 [01:21<00:13, 391.89 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▌| 106751/112050 [01:21<00:12, 430.39 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▋| 106798/112050 [01:21<00:11, 439.27 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▋| 106849/112050 [01:21<00:11, 457.14 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▋| 106897/112050 [01:22<00:12, 401.15 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▋| 106940/112050 [01:22<00:13, 389.71 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  95%|███████▋| 106982/112050 [01:22<00:13, 367.37 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  96%|███████▋| 107020/112050 [01:22<00:14, 340.86 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  96%|███████▋| 107057/112050 [01:22<00:14, 344.62 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  96%|███████▋| 107114/112050 [01:22<00:12, 389.50 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  96%|███████▋| 107156/112050 [01:22<00:12, 383.98 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  96%|███████▋| 107232/112050 [01:22<00:10, 481.33 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  96%|███████▋| 107290/112050 [01:23<00:09, 501.04 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  96%|███████▋| 107342/112050 [01:23<00:09, 501.66 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  96%|███████▋| 107393/112050 [01:23<00:09, 492.36 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  96%|███████▋| 107449/112050 [01:23<00:09, 502.28 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  96%|███████▋| 107501/112050 [01:23<00:10, 422.99 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  96%|███████▋| 107575/112050 [01:23<00:09, 477.05 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  96%|███████▋| 107653/112050 [01:23<00:08, 544.64 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 6] Global seed set to 1802196061\r\n",
-      "initializing deepspeed distributed: GLOBAL_RANK: 6, MEMBER: 7/8\r\n",
-      "[2023-09-01 02:58:30,598] [WARNING] [comm.py:152:init_deepspeed_backend] NCCL backend in DeepSpeed not yet implemented\r\n",
-      "\r",
-      "Map (num_proc=64):  96%|███████▋| 107727/112050 [01:23<00:07, 593.59 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  96%|███████▋| 107811/112050 [01:23<00:06, 653.70 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  96%|███████▋| 107918/112050 [01:24<00:05, 765.52 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  96%|███████▋| 108071/112050 [01:24<00:04, 980.77 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 2] Global seed set to 1802196061\r\n",
-      "initializing deepspeed distributed: GLOBAL_RANK: 2, MEMBER: 3/8\r\n",
-      "[2023-09-01 02:58:31,033] [WARNING] [comm.py:152:init_deepspeed_backend] NCCL backend in DeepSpeed not yet implemented\r\n",
-      "\r",
-      "Map (num_proc=64):  97%|██████▊| 108230/112050 [01:24<00:03, 1121.61 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  97%|██████▊| 108344/112050 [01:24<00:03, 1050.33 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  97%|███████▋| 108454/112050 [01:24<00:03, 974.05 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  97%|███████▊| 108564/112050 [01:24<00:03, 990.20 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  97%|██████▊| 108688/112050 [01:24<00:03, 1025.00 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  97%|██████▊| 108870/112050 [01:24<00:02, 1237.19 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  97%|██████▊| 109104/112050 [01:24<00:01, 1543.64 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  98%|██████▊| 109311/112050 [01:25<00:01, 1655.92 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 1] Global seed set to 1802196061\r\n",
-      "initializing deepspeed distributed: GLOBAL_RANK: 1, MEMBER: 2/8\r\n",
-      "[2023-09-01 02:58:31,940] [WARNING] [comm.py:152:init_deepspeed_backend] NCCL backend in DeepSpeed not yet implemented\r\n",
-      "\r",
-      "Map (num_proc=64):  98%|██████▊| 109481/112050 [01:25<00:01, 1525.90 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  98%|██████▊| 109640/112050 [01:25<00:01, 1459.31 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  98%|██████▊| 109789/112050 [01:25<00:01, 1374.16 examples/s][rank: 5] Global seed set to 1802196061\r\n",
-      "initializing deepspeed distributed: GLOBAL_RANK: 5, MEMBER: 6/8\r\n",
-      "[2023-09-01 02:58:32,221] [WARNING] [comm.py:152:init_deepspeed_backend] NCCL backend in DeepSpeed not yet implemented\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  98%|██████▊| 109938/112050 [01:25<00:01, 1388.97 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  98%|██████▉| 110081/112050 [01:25<00:01, 1320.51 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  98%|██████▉| 110219/112050 [01:25<00:01, 1291.04 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  98%|██████▉| 110350/112050 [01:25<00:01, 1168.33 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|██████▉| 110475/112050 [01:26<00:01, 1038.99 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|██████▉| 110586/112050 [01:26<00:01, 1009.77 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|██████▉| 110733/112050 [01:26<00:01, 1120.42 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|██████▉| 110877/112050 [01:26<00:00, 1201.04 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 111005/112050 [01:26<00:01, 917.45 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 111111/112050 [01:26<00:01, 826.59 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 111204/112050 [01:26<00:01, 741.99 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 111286/112050 [01:27<00:01, 745.27 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 111366/112050 [01:27<00:01, 643.80 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64):  99%|███████▉| 111439/112050 [01:27<00:01, 591.46 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 111507/112050 [01:27<00:00, 580.32 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 111574/112050 [01:27<00:00, 490.47 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 111630/112050 [01:27<00:00, 445.83 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 111678/112050 [01:28<00:00, 429.79 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 111725/112050 [01:28<00:00, 358.61 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 111769/112050 [01:28<00:00, 326.30 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 111806/112050 [01:28<00:00, 280.02 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 111837/112050 [01:28<00:00, 267.14 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 111866/112050 [01:28<00:00, 264.19 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 111899/112050 [01:28<00:00, 266.91 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 111937/112050 [01:29<00:00, 292.80 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Map (num_proc=64): 100%|███████▉| 112030/112050 [01:29<00:00, 417.58 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                                                                                \r"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):   0%|                   | 0/112050 [00:00<?, ? examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):   1%|       | 1000/112050 [00:01<02:22, 778.50 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):   3%|▏     | 3000/112050 [00:01<00:44, 2438.68 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):   5%|▎     | 6000/112050 [00:01<00:20, 5145.57 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):   7%|▍     | 8000/112050 [00:01<00:15, 6691.39 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):   9%|▍    | 10000/112050 [00:01<00:11, 8644.75 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  11%|▌    | 12000/112050 [00:02<00:10, 9585.27 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  13%|▌   | 14502/112050 [00:02<00:09, 10057.34 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  14%|▌   | 16002/112050 [00:02<00:09, 10226.26 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  17%|▋   | 18753/112050 [00:02<00:07, 12937.81 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  19%|▋   | 20753/112050 [00:02<00:06, 14225.48 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  21%|▊   | 23503/112050 [00:02<00:05, 16992.13 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  23%|▉   | 26253/112050 [00:02<00:04, 19281.05 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  27%|█   | 29755/112050 [00:03<00:03, 21834.20 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  29%|█▏  | 32505/112050 [00:03<00:04, 19367.36 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  33%|█▎  | 37006/112050 [00:03<00:03, 20825.26 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  38%|█▌  | 42508/112050 [00:03<00:02, 26148.16 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  43%|█▋  | 48508/112050 [00:03<00:02, 29185.14 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  46%|█▊  | 51508/112050 [00:03<00:02, 21401.49 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  49%|█▉  | 54511/112050 [00:04<00:02, 20919.28 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  51%|██  | 57511/112050 [00:04<00:02, 21088.04 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  53%|██▏ | 59764/112050 [00:04<00:02, 19280.17 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  57%|██▎ | 64015/112050 [00:04<00:02, 21817.38 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  60%|██▍ | 67015/112050 [00:04<00:02, 19025.90 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  64%|██▌ | 72018/112050 [00:04<00:01, 23965.82 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  68%|██▋ | 76520/112050 [00:04<00:01, 28331.58 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  72%|██▊ | 80523/112050 [00:05<00:01, 29296.02 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  75%|██▉ | 83775/112050 [00:05<00:01, 26602.66 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  78%|███ | 87027/112050 [00:05<00:01, 20672.93 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  80%|███▏| 89528/112050 [00:05<00:01, 16973.50 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  82%|███▎| 92030/112050 [00:05<00:01, 17801.11 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  85%|███▍| 95030/112050 [00:06<00:00, 18750.83 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  87%|███▍| 97532/112050 [00:06<00:00, 14694.42 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  89%|███▌| 99283/112050 [00:06<00:00, 13261.92 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  90%|██▋| 100785/112050 [00:06<00:00, 13505.37 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  91%|███▋| 102287/112050 [00:07<00:01, 7616.00 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  93%|███▋| 103789/112050 [00:07<00:01, 8155.24 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  95%|███▊| 106793/112050 [00:07<00:00, 5907.50 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  97%|███▉| 109046/112050 [00:08<00:00, 6643.71 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64):  99%|███▉| 110548/112050 [00:08<00:00, 5733.59 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Filter (num_proc=64): 100%|████| 112050/112050 [00:08<00:00, 5209.76 examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "                                                                                \r"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (0/2 shards):   0%|         | 0/80553 [00:00<?, ? examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (0/2 shards):  10%| | 8000/80553 [00:00<00:01, 68385.90 examp"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (0/2 shards):  22%|▏| 18000/80553 [00:00<00:00, 81310.10 exam"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (0/2 shards):  35%|▎| 28000/80553 [00:00<00:00, 87313.18 exam"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (0/2 shards):  47%|▍| 38000/80553 [00:00<00:00, 91072.34 exam"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (1/2 shards):  50%|▌| 40277/80553 [00:00<00:00, 91072.34 exam"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (1/2 shards):  62%|▌| 50277/80553 [00:00<00:00, 88980.15 exam"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (1/2 shards):  75%|▋| 60277/80553 [00:00<00:00, 91614.76 exam"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (1/2 shards):  87%|▊| 70277/80553 [00:00<00:00, 93178.67 exam"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (1/2 shards): 100%|▉| 80277/80553 [00:00<00:00, 94548.12 exam\r",
-      "Saving the dataset (2/2 shards): 100%|█| 80553/80553 [00:00<00:00, 94548.12 exam\r",
-      "                                                                                \r",
-      "\r",
-      "Saving the dataset (0/1 shards):   0%|            | 0/81 [00:00<?, ? examples/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Saving the dataset (1/1 shards): 100%|█| 81/81 [00:00<00:00, 6148.56 examples/s]\r",
-      "                                                                                \r"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[rank: 0] Global seed set to 1802196061\r\n",
-      "initializing deepspeed distributed: GLOBAL_RANK: 0, MEMBER: 1/8\r\n",
-      "[2023-09-01 02:59:03,997] [WARNING] [comm.py:152:init_deepspeed_backend] NCCL backend in DeepSpeed not yet implemented\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Enabling DeepSpeed BF16.\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "LOCAL_RANK: 7 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]\r\n",
-      "LOCAL_RANK: 2 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]\r\n",
-      "LOCAL_RANK: 4 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]\r\n",
-      "LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]\r\n",
-      "LOCAL_RANK: 3 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]\r\n",
-      "LOCAL_RANK: 1 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]\r\n",
-      "LOCAL_RANK: 5 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]\r\n",
-      "#\r\n",
-      "# RWKV lighting_trainer.py important notes \r\n",
-      "# https://github.com/RWKV/RWKV-infctx-trainer \r\n",
-      "#\r\n",
-      "# - Ensure your host is not running cuda 12.0 (use either 11.8, or >=12.1), as this is known to have freeze issues\r\n",
-      "# - The terms used in wandb / the progress bar can be confusing, see the github README.md for beter clarifications\r\n",
-      "# - When resuming from checkpoint, the estimated time is inaccurate\r\n",
-      "#\r\n",
-      "\r\n",
-      "[RWKV.model] Configuring optimizer with\r\n",
-      "    - lr_init:  3.000e-04 (0.0003)\r\n",
-      "    - lr_final: 1.000e-04 (0.0001)\r\n",
-      "\r\n",
-      "LOCAL_RANK: 6 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Detected CUDA files, patching ldflags\r\n",
-      "Emitting ninja build file /root/.cache/torch_extensions/py311_cu118/fused_adam/build.ninja...\r\n",
-      "Building extension module fused_adam...\r\n",
-      "Allowing ninja to set a default number of workers... (overridable by setting the environment variable MAX_JOBS=N)\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "ninja: no work to do.\r\n",
-      "Loading extension module fused_adam...\r\n",
-      "Time to load fused_adam op: 0.06886816024780273 seconds\r\n",
-      "Loading extension module fused_adam...\r\n",
-      "Loading extension module fused_adam...\r\n",
-      "Time to load fused_adam op: 0.10180830955505371 seconds\r\n",
-      "Time to load fused_adam op: 0.10175633430480957 seconds\r\n",
-      "Loading extension module fused_adam...\r\n",
-      "Loading extension module fused_adam...\r\n",
-      "Loading extension module fused_adam...\r\n",
-      "Time to load fused_adam op: 0.10140442848205566 seconds\r\n",
-      "Time to load fused_adam op: 0.10190558433532715 seconds\r\n",
-      "Time to load fused_adam op: 0.10192203521728516 seconds\r\n",
-      "Loading `train_dataloader` to estimate number of stepping batches.\r\n",
-      "Loading extension module fused_adam...\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Time to load fused_adam op: 0.10334587097167969 seconds\r\n",
-      "Loading extension module fused_adam...\r\n",
-      "Time to load fused_adam op: 0.10170531272888184 seconds\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Emitting ninja build file /root/.cache/torch_extensions/py311_cu118/utils/build.ninja...\r\n",
-      "Building extension module utils...\r\n",
-      "Allowing ninja to set a default number of workers... (overridable by setting the environment variable MAX_JOBS=N)\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "ninja: no work to do.\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.08224630355834961 seconds\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.10256481170654297 seconds\r\n",
-      "Loading extension module utils...\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.10213708877563477 seconds\r\n",
-      "Time to load utils op: 0.10302615165710449 seconds\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Loading extension module utils...\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.10284805297851562 seconds\r\n",
-      "Time to load utils op: 0.10296297073364258 seconds\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.10295629501342773 seconds\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.10236072540283203 seconds\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Rank: 2 partition count [8, 8] and sizes[(176584448, False), (384, False)] \r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Rank: 1 partition count [8, 8] and sizes[(176584448, False), (384, False)] \r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Rank: 0 partition count [8, 8] and sizes[(176584448, False), (384, False)] \r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Rank: 6 partition count [8, 8] and sizes[(176584448, False), (384, False)] \r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Rank: 3 partition count [8, 8] and sizes[(176584448, False), (384, False)] \r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Rank: 5 partition count [8, 8] and sizes[(176584448, False), (384, False)] \r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Rank: 4 partition count [8, 8] and sizes[(176584448, False), (384, False)] \r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Rank: 7 partition count [8, 8] and sizes[(176584448, False), (384, False)] \r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "No modifications detected for re-loaded extension module utils, skipping build step...\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.0009775161743164062 seconds\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "No modifications detected for re-loaded extension module utils, skipping build step...\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.000652313232421875 seconds\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "No modifications detected for re-loaded extension module utils, skipping build step...\r\n",
-      "Loading extension module utils...\r\n",
-      "No modifications detected for re-loaded extension module utils, skipping build step...\r\n",
-      "Loading extension module utils...\r\n",
-      "No modifications detected for re-loaded extension module utils, skipping build step...\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.0010175704956054688 seconds\r\n",
-      "Time to load utils op: 0.0006313323974609375 seconds\r\n",
-      "Time to load utils op: 0.0006577968597412109 seconds\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "No modifications detected for re-loaded extension module utils, skipping build step...\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.0011701583862304688 seconds\r\n",
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "No modifications detected for re-loaded extension module utils, skipping build step...\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.0011792182922363281 seconds\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Using /root/.cache/torch_extensions/py311_cu118 as PyTorch extensions root...\r\n",
-      "No modifications detected for re-loaded extension module utils, skipping build step...\r\n",
-      "Loading extension module utils...\r\n",
-      "Time to load utils op: 0.0008912086486816406 seconds\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "  | Name   | Type       | Params\r\n",
-      "--------------------------------------\r\n",
-      "0 | emb    | Embedding  | 51.5 M\r\n",
-      "1 | blocks | ModuleList | 1.3 B \r\n",
-      "2 | ln_out | LayerNorm  | 2.0 K \r\n",
-      "3 | head   | Linear     | 51.5 M\r\n",
-      "--------------------------------------\r\n",
-      "1.4 B     Trainable params\r\n",
-      "0         Non-trainable params\r\n",
-      "1.4 B     Total params\r\n",
-      "5,650.715 Total estimated model params size (MB)\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Training: 0it [00:00, ?it/s]\r",
-      "Training:   0%|                                       | 0/10070 [00:00<?, ?it/s]\r",
-      "Epoch 0:   0%|                                        | 0/10070 [00:00<?, ?it/s]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%|                             | 1/10070 [00:07<20:47:00,  7.43s/it]\r",
-      "Epoch 0:   0%| | 1/10070 [00:07<20:47:13,  7.43s/it, v_num=tif6, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 2/10070 [00:12<16:59:38,  6.08s/it, v_num=tif6, train/loss=0.00\r",
-      "Epoch 0:   0%| | 2/10070 [00:12<16:59:45,  6.08s/it, v_num=tif6, train/loss=5.22"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 3/10070 [00:14<13:11:32,  4.72s/it, v_num=tif6, train/loss=5.22\r",
-      "Epoch 0:   0%| | 3/10070 [00:14<13:11:35,  4.72s/it, v_num=tif6, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 4/10070 [00:15<10:51:19,  3.88s/it, v_num=tif6, train/loss=0.00\r",
-      "Epoch 0:   0%| | 4/10070 [00:15<10:51:21,  3.88s/it, v_num=tif6, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 5/10070 [00:16<9:03:36,  3.24s/it, v_num=tif6, train/loss=0.000\r",
-      "Epoch 0:   0%| | 5/10070 [00:16<9:03:38,  3.24s/it, v_num=tif6, train/loss=0.000"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 6/10070 [00:17<8:06:50,  2.90s/it, v_num=tif6, train/loss=0.000\r",
-      "Epoch 0:   0%| | 6/10070 [00:17<8:06:52,  2.90s/it, v_num=tif6, train/loss=0.271"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 7/10070 [00:18<7:33:01,  2.70s/it, v_num=tif6, train/loss=0.271\r",
-      "Epoch 0:   0%| | 7/10070 [00:18<7:33:02,  2.70s/it, v_num=tif6, train/loss=0.008"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 8/10070 [00:20<7:01:45,  2.51s/it, v_num=tif6, train/loss=0.008\r",
-      "Epoch 0:   0%| | 8/10070 [00:20<7:01:46,  2.52s/it, v_num=tif6, train/loss=0.022"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 9/10070 [00:21<6:41:22,  2.39s/it, v_num=tif6, train/loss=0.022\r",
-      "Epoch 0:   0%| | 9/10070 [00:21<6:41:22,  2.39s/it, v_num=tif6, train/loss=0.001"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 10/10070 [00:23<6:30:22,  2.33s/it, v_num=tif6, train/loss=0.00\r",
-      "Epoch 0:   0%| | 10/10070 [00:23<6:30:23,  2.33s/it, v_num=tif6, train/loss=1.43"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 11/10070 [00:24<6:20:42,  2.27s/it, v_num=tif6, train/loss=1.43\r",
-      "Epoch 0:   0%| | 11/10070 [00:24<6:20:43,  2.27s/it, v_num=tif6, train/loss=0.56"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 12/10070 [00:26<6:12:37,  2.22s/it, v_num=tif6, train/loss=0.56\r",
-      "Epoch 0:   0%| | 12/10070 [00:26<6:12:37,  2.22s/it, v_num=tif6, train/loss=1.21"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 13/10070 [00:27<5:59:45,  2.15s/it, v_num=tif6, train/loss=1.21\r",
-      "Epoch 0:   0%| | 13/10070 [00:27<5:59:46,  2.15s/it, v_num=tif6, train/loss=0.09"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 14/10070 [00:29<5:54:43,  2.12s/it, v_num=tif6, train/loss=0.09\r",
-      "Epoch 0:   0%| | 14/10070 [00:29<5:54:44,  2.12s/it, v_num=tif6, train/loss=1.48"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 15/10070 [00:30<5:38:32,  2.02s/it, v_num=tif6, train/loss=1.48\r",
-      "Epoch 0:   0%| | 15/10070 [00:30<5:38:33,  2.02s/it, v_num=tif6, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 16/10070 [00:31<5:32:30,  1.98s/it, v_num=tif6, train/loss=0.00\r",
-      "Epoch 0:   0%| | 16/10070 [00:31<5:32:30,  1.98s/it, v_num=tif6, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 17/10070 [00:32<5:19:40,  1.91s/it, v_num=tif6, train/loss=0.00\r",
-      "Epoch 0:   0%| | 17/10070 [00:32<5:19:40,  1.91s/it, v_num=tif6, train/loss=0.01"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 18/10070 [00:34<5:22:59,  1.93s/it, v_num=tif6, train/loss=0.01\r",
-      "Epoch 0:   0%| | 18/10070 [00:34<5:22:59,  1.93s/it, v_num=tif6, train/loss=4.09"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 19/10070 [00:35<5:11:51,  1.86s/it, v_num=tif6, train/loss=4.09\r",
-      "Epoch 0:   0%| | 19/10070 [00:35<5:11:51,  1.86s/it, v_num=tif6, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 20/10070 [00:37<5:10:21,  1.85s/it, v_num=tif6, train/loss=0.00\r",
-      "Epoch 0:   0%| | 20/10070 [00:37<5:10:21,  1.85s/it, v_num=tif6, train/loss=1.84"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 21/10070 [00:38<5:08:55,  1.84s/it, v_num=tif6, train/loss=1.84\r",
-      "Epoch 0:   0%| | 21/10070 [00:38<5:08:56,  1.84s/it, v_num=tif6, train/loss=0.83"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 22/10070 [00:40<5:07:40,  1.84s/it, v_num=tif6, train/loss=0.83\r",
-      "Epoch 0:   0%| | 22/10070 [00:40<5:07:40,  1.84s/it, v_num=tif6, train/loss=0.78"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 23/10070 [00:41<5:04:38,  1.82s/it, v_num=tif6, train/loss=0.78\r",
-      "Epoch 0:   0%| | 23/10070 [00:41<5:04:38,  1.82s/it, v_num=tif6, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 24/10070 [00:44<5:07:15,  1.84s/it, v_num=tif6, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 24/10070 [00:44<5:07:16,  1.84s/it, v_num=tif6, train/loss=3.02"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 25/10070 [00:46<5:09:27,  1.85s/it, v_num=tif6, train/loss=3.02\r",
-      "Epoch 0:   0%| | 25/10070 [00:46<5:09:27,  1.85s/it, v_num=tif6, train/loss=3.33"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 26/10070 [00:47<5:08:09,  1.84s/it, v_num=tif6, train/loss=3.33\r",
-      "Epoch 0:   0%| | 26/10070 [00:47<5:08:09,  1.84s/it, v_num=tif6, train/loss=0.71"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 27/10070 [00:49<5:07:15,  1.84s/it, v_num=tif6, train/loss=0.71\r",
-      "Epoch 0:   0%| | 27/10070 [00:49<5:07:15,  1.84s/it, v_num=tif6, train/loss=2.36"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 28/10070 [00:50<5:03:14,  1.81s/it, v_num=tif6, train/loss=2.36\r",
-      "Epoch 0:   0%| | 28/10070 [00:50<5:03:14,  1.81s/it, v_num=tif6, train/loss=0.19"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 29/10070 [00:52<5:02:27,  1.81s/it, v_num=tif6, train/loss=0.19\r",
-      "Epoch 0:   0%| | 29/10070 [00:52<5:02:27,  1.81s/it, v_num=tif6, train/loss=0.45"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 30/10070 [00:53<4:56:02,  1.77s/it, v_num=tif6, train/loss=0.45\r",
-      "Epoch 0:   0%| | 30/10070 [00:53<4:56:02,  1.77s/it, v_num=tif6, train/loss=0.01"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 31/10070 [00:55<4:58:16,  1.78s/it, v_num=tif6, train/loss=0.01\r",
-      "Epoch 0:   0%| | 31/10070 [00:55<4:58:16,  1.78s/it, v_num=tif6, train/loss=3.86"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 32/10070 [01:04<5:37:33,  2.02s/it, v_num=tif6, train/loss=3.86"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 32/10070 [01:07<5:52:36,  2.11s/it, v_num=tif6, train/loss=0.04"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 33/10070 [01:09<5:50:16,  2.09s/it, v_num=tif6, train/loss=0.04\r",
-      "Epoch 0:   0%| | 33/10070 [01:09<5:50:16,  2.09s/it, v_num=tif6, train/loss=6.94"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 34/10070 [01:11<5:50:51,  2.10s/it, v_num=tif6, train/loss=6.94\r",
-      "Epoch 0:   0%| | 34/10070 [01:11<5:50:51,  2.10s/it, v_num=tif6, train/loss=7.75"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 35/10070 [01:13<5:48:55,  2.09s/it, v_num=tif6, train/loss=7.75\r",
-      "Epoch 0:   0%| | 35/10070 [01:13<5:48:56,  2.09s/it, v_num=tif6, train/loss=7.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 36/10070 [01:13<5:42:22,  2.05s/it, v_num=tif6, train/loss=7.00\r",
-      "Epoch 0:   0%| | 36/10070 [01:13<5:42:23,  2.05s/it, v_num=tif6, train/loss=0.43"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 37/10070 [01:15<5:40:45,  2.04s/it, v_num=tif6, train/loss=0.43\r",
-      "Epoch 0:   0%| | 37/10070 [01:15<5:40:46,  2.04s/it, v_num=tif6, train/loss=7.56"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 38/10070 [01:16<5:36:57,  2.02s/it, v_num=tif6, train/loss=7.56\r",
-      "Epoch 0:   0%| | 38/10070 [01:16<5:36:57,  2.02s/it, v_num=tif6, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 39/10070 [01:17<5:33:21,  1.99s/it, v_num=tif6, train/loss=0.00\r",
-      "Epoch 0:   0%| | 39/10070 [01:17<5:33:21,  1.99s/it, v_num=tif6, train/loss=5.09"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 40/10070 [01:18<5:29:49,  1.97s/it, v_num=tif6, train/loss=5.09\r",
-      "Epoch 0:   0%| | 40/10070 [01:18<5:29:49,  1.97s/it, v_num=tif6, train/loss=3.52"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 41/10070 [01:21<5:30:50,  1.98s/it, v_num=tif6, train/loss=3.52\r",
-      "Epoch 0:   0%| | 41/10070 [01:21<5:30:50,  1.98s/it, v_num=tif6, train/loss=7.50"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 42/10070 [01:22<5:29:33,  1.97s/it, v_num=tif6, train/loss=7.50\r",
-      "Epoch 0:   0%| | 42/10070 [01:22<5:29:33,  1.97s/it, v_num=tif6, train/loss=6.62"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 43/10070 [01:23<5:26:18,  1.95s/it, v_num=tif6, train/loss=6.62\r",
-      "Epoch 0:   0%| | 43/10070 [01:23<5:26:18,  1.95s/it, v_num=tif6, train/loss=3.11"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 44/10070 [01:26<5:27:05,  1.96s/it, v_num=tif6, train/loss=3.11\r",
-      "Epoch 0:   0%| | 44/10070 [01:26<5:27:05,  1.96s/it, v_num=tif6, train/loss=8.38"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 45/10070 [01:27<5:26:01,  1.95s/it, v_num=tif6, train/loss=8.38\r",
-      "Epoch 0:   0%| | 45/10070 [01:27<5:26:02,  1.95s/it, v_num=tif6, train/loss=6.06"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 46/10070 [01:28<5:23:09,  1.93s/it, v_num=tif6, train/loss=6.06\r",
-      "Epoch 0:   0%| | 46/10070 [01:28<5:23:09,  1.93s/it, v_num=tif6, train/loss=5.44"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 47/10070 [01:31<5:24:03,  1.94s/it, v_num=tif6, train/loss=5.44\r",
-      "Epoch 0:   0%| | 47/10070 [01:31<5:24:03,  1.94s/it, v_num=tif6, train/loss=7.88"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 48/10070 [01:31<5:19:35,  1.91s/it, v_num=tif6, train/loss=7.88\r",
-      "Epoch 0:   0%| | 48/10070 [01:31<5:19:35,  1.91s/it, v_num=tif6, train/loss=1.74"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 49/10070 [01:33<5:18:47,  1.91s/it, v_num=tif6, train/loss=1.74\r",
-      "Epoch 0:   0%| | 49/10070 [01:33<5:18:47,  1.91s/it, v_num=tif6, train/loss=7.12"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   0%| | 50/10070 [01:34<5:16:14,  1.89s/it, v_num=tif6, train/loss=7.12\r",
-      "Epoch 0:   0%| | 50/10070 [01:34<5:16:14,  1.89s/it, v_num=tif6, train/loss=4.53"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 51/10070 [01:36<5:15:25,  1.89s/it, v_num=tif6, train/loss=4.53\r",
-      "Epoch 0:   1%| | 51/10070 [01:36<5:15:25,  1.89s/it, v_num=tif6, train/loss=5.75"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 52/10070 [01:38<5:16:27,  1.90s/it, v_num=tif6, train/loss=5.75\r",
-      "Epoch 0:   1%| | 52/10070 [01:38<5:16:27,  1.90s/it, v_num=tif6, train/loss=8.25"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 53/10070 [01:39<5:12:33,  1.87s/it, v_num=tif6, train/loss=8.25\r",
-      "Epoch 0:   1%| | 53/10070 [01:39<5:12:33,  1.87s/it, v_num=tif6, train/loss=2.36"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 54/10070 [01:40<5:10:21,  1.86s/it, v_num=tif6, train/loss=2.36\r",
-      "Epoch 0:   1%| | 54/10070 [01:40<5:10:21,  1.86s/it, v_num=tif6, train/loss=5.69"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 55/10070 [01:41<5:08:10,  1.85s/it, v_num=tif6, train/loss=5.69\r",
-      "Epoch 0:   1%| | 55/10070 [01:41<5:08:10,  1.85s/it, v_num=tif6, train/loss=3.27"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 56/10070 [01:43<5:07:44,  1.84s/it, v_num=tif6, train/loss=3.27\r",
-      "Epoch 0:   1%| | 56/10070 [01:43<5:07:44,  1.84s/it, v_num=tif6, train/loss=6.19"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 57/10070 [01:44<5:05:42,  1.83s/it, v_num=tif6, train/loss=6.19\r",
-      "Epoch 0:   1%| | 57/10070 [01:44<5:05:42,  1.83s/it, v_num=tif6, train/loss=3.45"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 58/10070 [01:46<5:05:16,  1.83s/it, v_num=tif6, train/loss=3.45\r",
-      "Epoch 0:   1%| | 58/10070 [01:46<5:05:16,  1.83s/it, v_num=tif6, train/loss=7.47"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 59/10070 [01:47<5:04:46,  1.83s/it, v_num=tif6, train/loss=7.47\r",
-      "Epoch 0:   1%| | 59/10070 [01:47<5:04:46,  1.83s/it, v_num=tif6, train/loss=6.34"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 60/10070 [01:49<5:04:27,  1.82s/it, v_num=tif6, train/loss=6.34\r",
-      "Epoch 0:   1%| | 60/10070 [01:49<5:04:27,  1.82s/it, v_num=tif6, train/loss=7.22"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 61/10070 [01:50<5:01:13,  1.81s/it, v_num=tif6, train/loss=7.22\r",
-      "Epoch 0:   1%| | 61/10070 [01:50<5:01:13,  1.81s/it, v_num=tif6, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 62/10070 [01:51<4:59:26,  1.80s/it, v_num=tif6, train/loss=0.00\r",
-      "Epoch 0:   1%| | 62/10070 [01:51<4:59:26,  1.80s/it, v_num=tif6, train/loss=2.86"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 63/10070 [01:51<4:56:24,  1.78s/it, v_num=tif6, train/loss=2.86\r",
-      "Epoch 0:   1%| | 63/10070 [01:51<4:56:24,  1.78s/it, v_num=tif6, train/loss=0.39"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 64/10070 [01:55<5:01:00,  1.80s/it, v_num=tif6, train/loss=0.39"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 64/10070 [01:58<5:08:33,  1.85s/it, v_num=tif6, train/loss=1.88"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 65/10070 [02:00<5:08:16,  1.85s/it, v_num=tif6, train/loss=1.88\r",
-      "Epoch 0:   1%| | 65/10070 [02:00<5:08:16,  1.85s/it, v_num=tif6, train/loss=7.69"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 66/10070 [02:00<5:05:17,  1.83s/it, v_num=tif6, train/loss=7.69\r",
-      "Epoch 0:   1%| | 66/10070 [02:00<5:05:17,  1.83s/it, v_num=tif6, train/loss=2.11"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 67/10070 [02:01<5:02:22,  1.81s/it, v_num=tif6, train/loss=2.11\r",
-      "Epoch 0:   1%| | 67/10070 [02:01<5:02:22,  1.81s/it, v_num=tif6, train/loss=0.31"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 68/10070 [02:02<5:00:51,  1.80s/it, v_num=tif6, train/loss=0.31\r",
-      "Epoch 0:   1%| | 68/10070 [02:02<5:00:51,  1.80s/it, v_num=tif6, train/loss=3.16"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 69/10070 [02:04<5:01:54,  1.81s/it, v_num=tif6, train/loss=3.16\r",
-      "Epoch 0:   1%| | 69/10070 [02:04<5:01:54,  1.81s/it, v_num=tif6, train/loss=8.31"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 70/10070 [02:05<4:59:13,  1.80s/it, v_num=tif6, train/loss=8.31\r",
-      "Epoch 0:   1%| | 70/10070 [02:05<4:59:13,  1.80s/it, v_num=tif6, train/loss=2.27"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 71/10070 [02:07<5:00:09,  1.80s/it, v_num=tif6, train/loss=2.27\r",
-      "Epoch 0:   1%| | 71/10070 [02:07<5:00:09,  1.80s/it, v_num=tif6, train/loss=2.81"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 72/10070 [02:08<4:57:29,  1.79s/it, v_num=tif6, train/loss=2.81\r",
-      "Epoch 0:   1%| | 72/10070 [02:08<4:57:29,  1.79s/it, v_num=tif6, train/loss=0.68"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 73/10070 [02:09<4:54:54,  1.77s/it, v_num=tif6, train/loss=0.68\r",
-      "Epoch 0:   1%| | 73/10070 [02:09<4:54:54,  1.77s/it, v_num=tif6, train/loss=1.49"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 74/10070 [02:10<4:53:31,  1.76s/it, v_num=tif6, train/loss=1.49\r",
-      "Epoch 0:   1%| | 74/10070 [02:10<4:53:31,  1.76s/it, v_num=tif6, train/loss=4.41"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 75/10070 [02:11<4:52:11,  1.75s/it, v_num=tif6, train/loss=4.41\r",
-      "Epoch 0:   1%| | 75/10070 [02:11<4:52:11,  1.75s/it, v_num=tif6, train/loss=6.62"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 76/10070 [02:12<4:50:59,  1.75s/it, v_num=tif6, train/loss=6.62\r",
-      "Epoch 0:   1%| | 76/10070 [02:12<4:50:59,  1.75s/it, v_num=tif6, train/loss=3.30"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 77/10070 [02:13<4:48:37,  1.73s/it, v_num=tif6, train/loss=3.30\r",
-      "Epoch 0:   1%| | 77/10070 [02:13<4:48:37,  1.73s/it, v_num=tif6, train/loss=0.46"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 78/10070 [02:14<4:47:20,  1.73s/it, v_num=tif6, train/loss=0.46\r",
-      "Epoch 0:   1%| | 78/10070 [02:14<4:47:20,  1.73s/it, v_num=tif6, train/loss=0.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 79/10070 [02:16<4:47:26,  1.73s/it, v_num=tif6, train/loss=0.00\r",
-      "Epoch 0:   1%| | 79/10070 [02:16<4:47:26,  1.73s/it, v_num=tif6, train/loss=8.06"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 80/10070 [02:18<4:48:30,  1.73s/it, v_num=tif6, train/loss=8.06\r",
-      "Epoch 0:   1%| | 80/10070 [02:18<4:48:30,  1.73s/it, v_num=tif6, train/loss=8.31"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 81/10070 [02:19<4:46:19,  1.72s/it, v_num=tif6, train/loss=8.31\r",
-      "Epoch 0:   1%| | 81/10070 [02:19<4:46:19,  1.72s/it, v_num=tif6, train/loss=0.96"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 82/10070 [02:20<4:45:16,  1.71s/it, v_num=tif6, train/loss=0.96\r",
-      "Epoch 0:   1%| | 82/10070 [02:20<4:45:16,  1.71s/it, v_num=tif6, train/loss=6.56"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 83/10070 [02:21<4:44:13,  1.71s/it, v_num=tif6, train/loss=6.56\r",
-      "Epoch 0:   1%| | 83/10070 [02:21<4:44:13,  1.71s/it, v_num=tif6, train/loss=5.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 84/10070 [02:22<4:42:11,  1.70s/it, v_num=tif6, train/loss=5.00\r",
-      "Epoch 0:   1%| | 84/10070 [02:22<4:42:11,  1.70s/it, v_num=tif6, train/loss=0.21"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 85/10070 [02:24<4:43:16,  1.70s/it, v_num=tif6, train/loss=0.21\r",
-      "Epoch 0:   1%| | 85/10070 [02:24<4:43:16,  1.70s/it, v_num=tif6, train/loss=8.56"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 86/10070 [02:25<4:41:17,  1.69s/it, v_num=tif6, train/loss=8.56\r",
-      "Epoch 0:   1%| | 86/10070 [02:25<4:41:17,  1.69s/it, v_num=tif6, train/loss=1.50"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 87/10070 [02:26<4:39:20,  1.68s/it, v_num=tif6, train/loss=1.50\r",
-      "Epoch 0:   1%| | 87/10070 [02:26<4:39:20,  1.68s/it, v_num=tif6, train/loss=0.22"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 88/10070 [02:27<4:38:27,  1.67s/it, v_num=tif6, train/loss=0.22\r",
-      "Epoch 0:   1%| | 88/10070 [02:27<4:38:27,  1.67s/it, v_num=tif6, train/loss=6.06"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 89/10070 [02:27<4:36:35,  1.66s/it, v_num=tif6, train/loss=6.06\r",
-      "Epoch 0:   1%| | 89/10070 [02:27<4:36:35,  1.66s/it, v_num=tif6, train/loss=0.86"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 90/10070 [02:29<4:36:40,  1.66s/it, v_num=tif6, train/loss=0.86\r",
-      "Epoch 0:   1%| | 90/10070 [02:29<4:36:40,  1.66s/it, v_num=tif6, train/loss=6.72"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 91/10070 [02:31<4:37:44,  1.67s/it, v_num=tif6, train/loss=6.72\r",
-      "Epoch 0:   1%| | 91/10070 [02:31<4:37:44,  1.67s/it, v_num=tif6, train/loss=8.31"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 92/10070 [02:33<4:36:51,  1.66s/it, v_num=tif6, train/loss=8.31\r",
-      "Epoch 0:   1%| | 92/10070 [02:33<4:36:51,  1.66s/it, v_num=tif6, train/loss=3.34"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 93/10070 [02:35<4:37:52,  1.67s/it, v_num=tif6, train/loss=3.34\r",
-      "Epoch 0:   1%| | 93/10070 [02:35<4:37:52,  1.67s/it, v_num=tif6, train/loss=8.38"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 94/10070 [02:36<4:37:00,  1.67s/it, v_num=tif6, train/loss=8.38\r",
-      "Epoch 0:   1%| | 94/10070 [02:36<4:37:00,  1.67s/it, v_num=tif6, train/loss=4.22"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 95/10070 [02:38<4:37:03,  1.67s/it, v_num=tif6, train/loss=4.22\r",
-      "Epoch 0:   1%| | 95/10070 [02:38<4:37:03,  1.67s/it, v_num=tif6, train/loss=8.00"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 96/10070 [02:54<5:01:29,  1.81s/it, v_num=tif6, train/loss=8.00\r",
-      "Epoch 0:   1%| | 96/10070 [02:54<5:01:29,  1.81s/it, v_num=tif6, train/loss=4.94"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 97/10070 [02:55<5:00:22,  1.81s/it, v_num=tif6, train/loss=4.94\r",
-      "Epoch 0:   1%| | 97/10070 [02:55<5:00:22,  1.81s/it, v_num=tif6, train/loss=2.88"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 98/10070 [02:55<4:58:26,  1.80s/it, v_num=tif6, train/loss=2.88\r",
-      "Epoch 0:   1%| | 98/10070 [02:55<4:58:26,  1.80s/it, v_num=tif6, train/loss=0.83"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 99/10070 [02:57<4:57:26,  1.79s/it, v_num=tif6, train/loss=0.83\r",
-      "Epoch 0:   1%| | 99/10070 [02:57<4:57:26,  1.79s/it, v_num=tif6, train/loss=4.06"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 100/10070 [02:57<4:55:34,  1.78s/it, v_num=tif6, train/loss=4.0\r",
-      "Epoch 0:   1%| | 100/10070 [02:57<4:55:34,  1.78s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 101/10070 [02:58<4:53:43,  1.77s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   1%| | 101/10070 [02:58<4:53:43,  1.77s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 102/10070 [03:00<4:54:27,  1.77s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   1%| | 102/10070 [03:00<4:54:27,  1.77s/it, v_num=tif6, train/loss=6.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 103/10070 [03:01<4:52:39,  1.76s/it, v_num=tif6, train/loss=6.4\r",
-      "Epoch 0:   1%| | 103/10070 [03:01<4:52:39,  1.76s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 104/10070 [03:03<4:52:31,  1.76s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   1%| | 104/10070 [03:03<4:52:31,  1.76s/it, v_num=tif6, train/loss=4.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 105/10070 [03:03<4:50:45,  1.75s/it, v_num=tif6, train/loss=4.7\r",
-      "Epoch 0:   1%| | 105/10070 [03:03<4:50:45,  1.75s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 106/10070 [03:05<4:49:50,  1.75s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   1%| | 106/10070 [03:05<4:49:50,  1.75s/it, v_num=tif6, train/loss=2.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 107/10070 [03:06<4:49:45,  1.75s/it, v_num=tif6, train/loss=2.7\r",
-      "Epoch 0:   1%| | 107/10070 [03:06<4:49:45,  1.75s/it, v_num=tif6, train/loss=5.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 108/10070 [03:07<4:48:50,  1.74s/it, v_num=tif6, train/loss=5.9\r",
-      "Epoch 0:   1%| | 108/10070 [03:07<4:48:50,  1.74s/it, v_num=tif6, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 109/10070 [03:09<4:48:46,  1.74s/it, v_num=tif6, train/loss=3.1\r",
-      "Epoch 0:   1%| | 109/10070 [03:09<4:48:46,  1.74s/it, v_num=tif6, train/loss=5.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 110/10070 [03:10<4:47:54,  1.73s/it, v_num=tif6, train/loss=5.9\r",
-      "Epoch 0:   1%| | 110/10070 [03:10<4:47:54,  1.73s/it, v_num=tif6, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 111/10070 [03:12<4:48:27,  1.74s/it, v_num=tif6, train/loss=3.5\r",
-      "Epoch 0:   1%| | 111/10070 [03:12<4:48:27,  1.74s/it, v_num=tif6, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 112/10070 [03:14<4:47:36,  1.73s/it, v_num=tif6, train/loss=1.1\r",
-      "Epoch 0:   1%| | 112/10070 [03:14<4:47:36,  1.73s/it, v_num=tif6, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 113/10070 [03:14<4:46:01,  1.72s/it, v_num=tif6, train/loss=1.8\r",
-      "Epoch 0:   1%| | 113/10070 [03:14<4:46:01,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 114/10070 [03:15<4:44:27,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   1%| | 114/10070 [03:15<4:44:27,  1.71s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 115/10070 [03:17<4:44:26,  1.71s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   1%| | 115/10070 [03:17<4:44:26,  1.71s/it, v_num=tif6, train/loss=5.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 116/10070 [03:18<4:44:26,  1.71s/it, v_num=tif6, train/loss=5.5\r",
-      "Epoch 0:   1%| | 116/10070 [03:18<4:44:26,  1.71s/it, v_num=tif6, train/loss=5.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 117/10070 [03:20<4:44:22,  1.71s/it, v_num=tif6, train/loss=5.2\r",
-      "Epoch 0:   1%| | 117/10070 [03:20<4:44:22,  1.71s/it, v_num=tif6, train/loss=4.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 118/10070 [03:21<4:42:52,  1.71s/it, v_num=tif6, train/loss=4.9\r",
-      "Epoch 0:   1%| | 118/10070 [03:21<4:42:52,  1.71s/it, v_num=tif6, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 119/10070 [03:21<4:41:23,  1.70s/it, v_num=tif6, train/loss=0.4\r",
-      "Epoch 0:   1%| | 119/10070 [03:21<4:41:23,  1.70s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 120/10070 [03:23<4:41:20,  1.70s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   1%| | 120/10070 [03:23<4:41:20,  1.70s/it, v_num=tif6, train/loss=4.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 121/10070 [03:24<4:39:54,  1.69s/it, v_num=tif6, train/loss=4.2\r",
-      "Epoch 0:   1%| | 121/10070 [03:24<4:39:54,  1.69s/it, v_num=tif6, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 122/10070 [03:25<4:39:10,  1.68s/it, v_num=tif6, train/loss=0.9\r",
-      "Epoch 0:   1%| | 122/10070 [03:25<4:39:10,  1.68s/it, v_num=tif6, train/loss=2.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 123/10070 [03:27<4:39:07,  1.68s/it, v_num=tif6, train/loss=2.6\r",
-      "Epoch 0:   1%| | 123/10070 [03:27<4:39:07,  1.68s/it, v_num=tif6, train/loss=4.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 124/10070 [03:28<4:39:05,  1.68s/it, v_num=tif6, train/loss=4.9\r",
-      "Epoch 0:   1%| | 124/10070 [03:28<4:39:05,  1.68s/it, v_num=tif6, train/loss=4.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 125/10070 [03:29<4:37:42,  1.68s/it, v_num=tif6, train/loss=4.8\r",
-      "Epoch 0:   1%| | 125/10070 [03:29<4:37:42,  1.68s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 126/10070 [03:31<4:38:21,  1.68s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   1%| | 126/10070 [03:31<4:38:21,  1.68s/it, v_num=tif6, train/loss=6.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 127/10070 [03:32<4:37:40,  1.68s/it, v_num=tif6, train/loss=6.2\r",
-      "Epoch 0:   1%| | 127/10070 [03:32<4:37:41,  1.68s/it, v_num=tif6, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 128/10070 [03:47<4:54:33,  1.78s/it, v_num=tif6, train/loss=2.0\r",
-      "Epoch 0:   1%| | 128/10070 [03:47<4:54:33,  1.78s/it, v_num=tif6, train/loss=6.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 129/10070 [03:49<4:54:26,  1.78s/it, v_num=tif6, train/loss=6.8\r",
-      "Epoch 0:   1%| | 129/10070 [03:49<4:54:26,  1.78s/it, v_num=tif6, train/loss=4.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 130/10070 [03:50<4:53:43,  1.77s/it, v_num=tif6, train/loss=4.1\r",
-      "Epoch 0:   1%| | 130/10070 [03:50<4:53:43,  1.77s/it, v_num=tif6, train/loss=3.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 131/10070 [03:51<4:52:55,  1.77s/it, v_num=tif6, train/loss=3.4\r",
-      "Epoch 0:   1%| | 131/10070 [03:51<4:52:55,  1.77s/it, v_num=tif6, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 132/10070 [03:52<4:51:32,  1.76s/it, v_num=tif6, train/loss=1.1\r",
-      "Epoch 0:   1%| | 132/10070 [03:52<4:51:32,  1.76s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 133/10070 [03:53<4:50:48,  1.76s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   1%| | 133/10070 [03:53<4:50:48,  1.76s/it, v_num=tif6, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 134/10070 [03:54<4:50:03,  1.75s/it, v_num=tif6, train/loss=2.5\r",
-      "Epoch 0:   1%| | 134/10070 [03:54<4:50:04,  1.75s/it, v_num=tif6, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 135/10070 [03:55<4:48:42,  1.74s/it, v_num=tif6, train/loss=0.7\r",
-      "Epoch 0:   1%| | 135/10070 [03:55<4:48:42,  1.74s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 136/10070 [03:57<4:49:19,  1.75s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   1%| | 136/10070 [03:57<4:49:19,  1.75s/it, v_num=tif6, train/loss=6.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 137/10070 [03:59<4:49:17,  1.75s/it, v_num=tif6, train/loss=6.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 137/10070 [03:59<4:49:17,  1.75s/it, v_num=tif6, train/loss=3.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 138/10070 [04:00<4:48:36,  1.74s/it, v_num=tif6, train/loss=3.4\r",
-      "Epoch 0:   1%| | 138/10070 [04:00<4:48:36,  1.74s/it, v_num=tif6, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 139/10070 [04:01<4:47:19,  1.74s/it, v_num=tif6, train/loss=1.2\r",
-      "Epoch 0:   1%| | 139/10070 [04:01<4:47:19,  1.74s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 140/10070 [04:03<4:47:18,  1.74s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   1%| | 140/10070 [04:03<4:47:18,  1.74s/it, v_num=tif6, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 141/10070 [04:03<4:46:03,  1.73s/it, v_num=tif6, train/loss=3.3\r",
-      "Epoch 0:   1%| | 141/10070 [04:03<4:46:03,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 142/10070 [04:04<4:45:25,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   1%| | 142/10070 [04:04<4:45:25,  1.72s/it, v_num=tif6, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 143/10070 [04:05<4:44:11,  1.72s/it, v_num=tif6, train/loss=1.1\r",
-      "Epoch 0:   1%| | 143/10070 [04:05<4:44:11,  1.72s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 144/10070 [04:07<4:44:10,  1.72s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   1%| | 144/10070 [04:07<4:44:10,  1.72s/it, v_num=tif6, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 145/10070 [04:09<4:44:47,  1.72s/it, v_num=tif6, train/loss=3.3\r",
-      "Epoch 0:   1%| | 145/10070 [04:09<4:44:47,  1.72s/it, v_num=tif6, train/loss=5.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 146/10070 [04:11<4:44:47,  1.72s/it, v_num=tif6, train/loss=5.9\r",
-      "Epoch 0:   1%| | 146/10070 [04:11<4:44:47,  1.72s/it, v_num=tif6, train/loss=5.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 147/10070 [04:12<4:44:12,  1.72s/it, v_num=tif6, train/loss=5.2\r",
-      "Epoch 0:   1%| | 147/10070 [04:12<4:44:12,  1.72s/it, v_num=tif6, train/loss=3.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 148/10070 [04:14<4:44:09,  1.72s/it, v_num=tif6, train/loss=3.0\r",
-      "Epoch 0:   1%| | 148/10070 [04:14<4:44:09,  1.72s/it, v_num=tif6, train/loss=4.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 149/10070 [04:15<4:43:33,  1.71s/it, v_num=tif6, train/loss=4.1\r",
-      "Epoch 0:   1%| | 149/10070 [04:15<4:43:33,  1.71s/it, v_num=tif6, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 150/10070 [04:16<4:42:57,  1.71s/it, v_num=tif6, train/loss=2.1\r",
-      "Epoch 0:   1%| | 150/10070 [04:16<4:42:57,  1.71s/it, v_num=tif6, train/loss=2.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   1%| | 151/10070 [04:17<4:41:47,  1.70s/it, v_num=tif6, train/loss=2.3\r",
-      "Epoch 0:   1%| | 151/10070 [04:17<4:41:47,  1.70s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 152/10070 [04:18<4:40:38,  1.70s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   2%| | 152/10070 [04:18<4:40:38,  1.70s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 153/10070 [04:18<4:39:30,  1.69s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   2%| | 153/10070 [04:18<4:39:30,  1.69s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 154/10070 [04:20<4:39:29,  1.69s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:   2%| | 154/10070 [04:20<4:39:29,  1.69s/it, v_num=tif6, train/loss=4.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 155/10070 [04:21<4:38:23,  1.68s/it, v_num=tif6, train/loss=4.9\r",
-      "Epoch 0:   2%| | 155/10070 [04:21<4:38:23,  1.68s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 156/10070 [04:22<4:38:24,  1.68s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   2%| | 156/10070 [04:22<4:38:24,  1.68s/it, v_num=tif6, train/loss=5.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 157/10070 [04:23<4:37:19,  1.68s/it, v_num=tif6, train/loss=5.0\r",
-      "Epoch 0:   2%| | 157/10070 [04:23<4:37:19,  1.68s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 158/10070 [04:25<4:37:56,  1.68s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   2%| | 158/10070 [04:25<4:37:56,  1.68s/it, v_num=tif6, train/loss=5.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 159/10070 [04:28<4:38:31,  1.69s/it, v_num=tif6, train/loss=5.6\r",
-      "Epoch 0:   2%| | 159/10070 [04:28<4:38:31,  1.69s/it, v_num=tif6, train/loss=5.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 160/10070 [04:38<4:47:28,  1.74s/it, v_num=tif6, train/loss=5.1\r",
-      "Epoch 0:   2%| | 160/10070 [04:38<4:47:28,  1.74s/it, v_num=tif6, train/loss=5.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 161/10070 [04:39<4:46:22,  1.73s/it, v_num=tif6, train/loss=5.2\r",
-      "Epoch 0:   2%| | 161/10070 [04:39<4:46:22,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 162/10070 [04:40<4:45:49,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   2%| | 162/10070 [04:40<4:45:49,  1.73s/it, v_num=tif6, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 163/10070 [04:42<4:46:21,  1.73s/it, v_num=tif6, train/loss=1.5\r",
-      "Epoch 0:   2%| | 163/10070 [04:42<4:46:21,  1.73s/it, v_num=tif6, train/loss=6.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 164/10070 [04:43<4:45:46,  1.73s/it, v_num=tif6, train/loss=6.0\r",
-      "Epoch 0:   2%| | 164/10070 [04:43<4:45:46,  1.73s/it, v_num=tif6, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 165/10070 [04:45<4:45:13,  1.73s/it, v_num=tif6, train/loss=2.0\r",
-      "Epoch 0:   2%| | 165/10070 [04:45<4:45:13,  1.73s/it, v_num=tif6, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 166/10070 [04:45<4:44:09,  1.72s/it, v_num=tif6, train/loss=1.0\r",
-      "Epoch 0:   2%| | 166/10070 [04:45<4:44:09,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 167/10070 [04:47<4:44:09,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   2%| | 167/10070 [04:47<4:44:09,  1.72s/it, v_num=tif6, train/loss=4.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 168/10070 [04:48<4:43:06,  1.72s/it, v_num=tif6, train/loss=4.0\r",
-      "Epoch 0:   2%| | 168/10070 [04:48<4:43:06,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 169/10070 [04:49<4:42:36,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   2%| | 169/10070 [04:49<4:42:36,  1.71s/it, v_num=tif6, train/loss=2.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 170/10070 [04:51<4:42:36,  1.71s/it, v_num=tif6, train/loss=2.8\r",
-      "Epoch 0:   2%| | 170/10070 [04:51<4:42:36,  1.71s/it, v_num=tif6, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 171/10070 [04:51<4:41:33,  1.71s/it, v_num=tif6, train/loss=3.3\r",
-      "Epoch 0:   2%| | 171/10070 [04:51<4:41:34,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 172/10070 [04:53<4:41:02,  1.70s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   2%| | 172/10070 [04:53<4:41:02,  1.70s/it, v_num=tif6, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 173/10070 [04:54<4:40:31,  1.70s/it, v_num=tif6, train/loss=1.3\r",
-      "Epoch 0:   2%| | 173/10070 [04:54<4:40:31,  1.70s/it, v_num=tif6, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 174/10070 [04:55<4:40:00,  1.70s/it, v_num=tif6, train/loss=1.3\r",
-      "Epoch 0:   2%| | 174/10070 [04:55<4:40:00,  1.70s/it, v_num=tif6, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 175/10070 [04:57<4:40:29,  1.70s/it, v_num=tif6, train/loss=2.5\r",
-      "Epoch 0:   2%| | 175/10070 [04:57<4:40:29,  1.70s/it, v_num=tif6, train/loss=5.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 176/10070 [04:58<4:39:29,  1.69s/it, v_num=tif6, train/loss=5.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 176/10070 [04:58<4:39:29,  1.69s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 177/10070 [04:59<4:38:59,  1.69s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   2%| | 177/10070 [04:59<4:38:59,  1.69s/it, v_num=tif6, train/loss=3.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 178/10070 [05:01<4:39:28,  1.70s/it, v_num=tif6, train/loss=3.0\r",
-      "Epoch 0:   2%| | 178/10070 [05:01<4:39:28,  1.70s/it, v_num=tif6, train/loss=5.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 179/10070 [05:03<4:39:55,  1.70s/it, v_num=tif6, train/loss=5.6\r",
-      "Epoch 0:   2%| | 179/10070 [05:03<4:39:55,  1.70s/it, v_num=tif6, train/loss=6.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 180/10070 [05:05<4:39:24,  1.70s/it, v_num=tif6, train/loss=6.1\r",
-      "Epoch 0:   2%| | 180/10070 [05:05<4:39:24,  1.70s/it, v_num=tif6, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 181/10070 [05:05<4:38:25,  1.69s/it, v_num=tif6, train/loss=0.9\r",
-      "Epoch 0:   2%| | 181/10070 [05:05<4:38:25,  1.69s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 182/10070 [05:06<4:37:58,  1.69s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   2%| | 182/10070 [05:06<4:37:58,  1.69s/it, v_num=tif6, train/loss=2.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 183/10070 [05:08<4:38:02,  1.69s/it, v_num=tif6, train/loss=2.9\r",
-      "Epoch 0:   2%| | 183/10070 [05:08<4:38:02,  1.69s/it, v_num=tif6, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 184/10070 [05:11<4:38:33,  1.69s/it, v_num=tif6, train/loss=3.3\r",
-      "Epoch 0:   2%| | 184/10070 [05:11<4:38:33,  1.69s/it, v_num=tif6, train/loss=6.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 185/10070 [05:13<4:39:03,  1.69s/it, v_num=tif6, train/loss=6.1\r",
-      "Epoch 0:   2%| | 185/10070 [05:13<4:39:03,  1.69s/it, v_num=tif6, train/loss=5.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 186/10070 [05:15<4:39:05,  1.69s/it, v_num=tif6, train/loss=5.0\r",
-      "Epoch 0:   2%| | 186/10070 [05:15<4:39:05,  1.69s/it, v_num=tif6, train/loss=4.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 187/10070 [05:16<4:39:08,  1.69s/it, v_num=tif6, train/loss=4.9\r",
-      "Epoch 0:   2%| | 187/10070 [05:16<4:39:08,  1.69s/it, v_num=tif6, train/loss=4.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 188/10070 [05:19<4:39:37,  1.70s/it, v_num=tif6, train/loss=4.3\r",
-      "Epoch 0:   2%| | 188/10070 [05:19<4:39:37,  1.70s/it, v_num=tif6, train/loss=5.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 189/10070 [05:20<4:39:10,  1.70s/it, v_num=tif6, train/loss=5.5\r",
-      "Epoch 0:   2%| | 189/10070 [05:20<4:39:10,  1.70s/it, v_num=tif6, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 190/10070 [05:22<4:39:41,  1.70s/it, v_num=tif6, train/loss=1.0\r",
-      "Epoch 0:   2%| | 190/10070 [05:22<4:39:41,  1.70s/it, v_num=tif6, train/loss=5.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 191/10070 [05:23<4:39:16,  1.70s/it, v_num=tif6, train/loss=5.1\r",
-      "Epoch 0:   2%| | 191/10070 [05:23<4:39:16,  1.70s/it, v_num=tif6, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 192/10070 [05:32<4:44:56,  1.73s/it, v_num=tif6, train/loss=1.8\r",
-      "Epoch 0:   2%| | 192/10070 [05:32<4:44:56,  1.73s/it, v_num=tif6, train/loss=3.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 193/10070 [05:33<4:44:29,  1.73s/it, v_num=tif6, train/loss=3.9\r",
-      "Epoch 0:   2%| | 193/10070 [05:33<4:44:29,  1.73s/it, v_num=tif6, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 194/10070 [05:35<4:44:56,  1.73s/it, v_num=tif6, train/loss=2.2\r",
-      "Epoch 0:   2%| | 194/10070 [05:35<4:44:56,  1.73s/it, v_num=tif6, train/loss=5.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 195/10070 [05:36<4:44:01,  1.73s/it, v_num=tif6, train/loss=5.8\r",
-      "Epoch 0:   2%| | 195/10070 [05:36<4:44:01,  1.73s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 196/10070 [05:37<4:43:33,  1.72s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   2%| | 196/10070 [05:37<4:43:33,  1.72s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 197/10070 [05:38<4:43:05,  1.72s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   2%| | 197/10070 [05:38<4:43:05,  1.72s/it, v_num=tif6, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 198/10070 [05:39<4:42:10,  1.72s/it, v_num=tif6, train/loss=0.7\r",
-      "Epoch 0:   2%| | 198/10070 [05:39<4:42:10,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 199/10070 [05:40<4:41:41,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   2%| | 199/10070 [05:40<4:41:41,  1.71s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 200/10070 [05:42<4:41:40,  1.71s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:   2%| | 200/10070 [05:42<4:41:40,  1.71s/it, v_num=tif6, train/loss=3.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 201/10070 [05:44<4:41:38,  1.71s/it, v_num=tif6, train/loss=3.6\r",
-      "Epoch 0:   2%| | 201/10070 [05:44<4:41:38,  1.71s/it, v_num=tif6, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 202/10070 [05:45<4:41:37,  1.71s/it, v_num=tif6, train/loss=3.2\r",
-      "Epoch 0:   2%| | 202/10070 [05:45<4:41:37,  1.71s/it, v_num=tif6, train/loss=3.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 203/10070 [05:46<4:40:45,  1.71s/it, v_num=tif6, train/loss=3.0\r",
-      "Epoch 0:   2%| | 203/10070 [05:46<4:40:45,  1.71s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 204/10070 [05:47<4:39:53,  1.70s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   2%| | 204/10070 [05:47<4:39:53,  1.70s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 205/10070 [05:48<4:39:28,  1.70s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   2%| | 205/10070 [05:48<4:39:28,  1.70s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 206/10070 [05:50<4:39:29,  1.70s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   2%| | 206/10070 [05:50<4:39:29,  1.70s/it, v_num=tif6, train/loss=3.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 207/10070 [05:51<4:39:30,  1.70s/it, v_num=tif6, train/loss=3.7\r",
-      "Epoch 0:   2%| | 207/10070 [05:51<4:39:30,  1.70s/it, v_num=tif6, train/loss=3.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 208/10070 [05:53<4:39:30,  1.70s/it, v_num=tif6, train/loss=3.8\r",
-      "Epoch 0:   2%| | 208/10070 [05:53<4:39:30,  1.70s/it, v_num=tif6, train/loss=3.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 209/10070 [05:55<4:39:31,  1.70s/it, v_num=tif6, train/loss=3.0\r",
-      "Epoch 0:   2%| | 209/10070 [05:55<4:39:31,  1.70s/it, v_num=tif6, train/loss=3.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 210/10070 [05:56<4:39:06,  1.70s/it, v_num=tif6, train/loss=3.9\r",
-      "Epoch 0:   2%| | 210/10070 [05:56<4:39:06,  1.70s/it, v_num=tif6, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 211/10070 [05:57<4:38:18,  1.69s/it, v_num=tif6, train/loss=1.7\r",
-      "Epoch 0:   2%| | 211/10070 [05:57<4:38:18,  1.69s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 212/10070 [05:59<4:38:17,  1.69s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   2%| | 212/10070 [05:59<4:38:17,  1.69s/it, v_num=tif6, train/loss=2.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 213/10070 [05:59<4:37:29,  1.69s/it, v_num=tif6, train/loss=2.8\r",
-      "Epoch 0:   2%| | 213/10070 [05:59<4:37:29,  1.69s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 214/10070 [06:02<4:37:56,  1.69s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   2%| | 214/10070 [06:02<4:37:56,  1.69s/it, v_num=tif6, train/loss=5.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 215/10070 [06:03<4:37:57,  1.69s/it, v_num=tif6, train/loss=5.5\r",
-      "Epoch 0:   2%| | 215/10070 [06:03<4:37:57,  1.69s/it, v_num=tif6, train/loss=3.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 216/10070 [06:05<4:37:56,  1.69s/it, v_num=tif6, train/loss=3.0\r",
-      "Epoch 0:   2%| | 216/10070 [06:05<4:37:56,  1.69s/it, v_num=tif6, train/loss=2.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 217/10070 [06:06<4:37:09,  1.69s/it, v_num=tif6, train/loss=2.6\r",
-      "Epoch 0:   2%| | 217/10070 [06:06<4:37:09,  1.69s/it, v_num=tif6, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 218/10070 [06:07<4:36:48,  1.69s/it, v_num=tif6, train/loss=0.4\r",
-      "Epoch 0:   2%| | 218/10070 [06:07<4:36:48,  1.69s/it, v_num=tif6, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 219/10070 [06:09<4:36:49,  1.69s/it, v_num=tif6, train/loss=1.6\r",
-      "Epoch 0:   2%| | 219/10070 [06:09<4:36:50,  1.69s/it, v_num=tif6, train/loss=3.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 220/10070 [06:10<4:36:50,  1.69s/it, v_num=tif6, train/loss=3.0\r",
-      "Epoch 0:   2%| | 220/10070 [06:10<4:36:50,  1.69s/it, v_num=tif6, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 221/10070 [06:13<4:37:15,  1.69s/it, v_num=tif6, train/loss=3.1\r",
-      "Epoch 0:   2%| | 221/10070 [06:13<4:37:15,  1.69s/it, v_num=tif6, train/loss=5.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 222/10070 [06:15<4:37:40,  1.69s/it, v_num=tif6, train/loss=5.6\r",
-      "Epoch 0:   2%| | 222/10070 [06:15<4:37:40,  1.69s/it, v_num=tif6, train/loss=5.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 223/10070 [06:16<4:37:17,  1.69s/it, v_num=tif6, train/loss=5.9\r",
-      "Epoch 0:   2%| | 223/10070 [06:16<4:37:17,  1.69s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 224/10070 [06:27<4:43:55,  1.73s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   2%| | 224/10070 [06:27<4:43:55,  1.73s/it, v_num=tif6, train/loss=4.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 225/10070 [06:29<4:43:57,  1.73s/it, v_num=tif6, train/loss=4.2\r",
-      "Epoch 0:   2%| | 225/10070 [06:29<4:43:57,  1.73s/it, v_num=tif6, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 226/10070 [06:30<4:43:31,  1.73s/it, v_num=tif6, train/loss=2.5\r",
-      "Epoch 0:   2%| | 226/10070 [06:30<4:43:31,  1.73s/it, v_num=tif6, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 227/10070 [06:31<4:42:45,  1.72s/it, v_num=tif6, train/loss=0.8\r",
-      "Epoch 0:   2%| | 227/10070 [06:31<4:42:45,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 228/10070 [06:33<4:42:44,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   2%| | 228/10070 [06:33<4:42:44,  1.72s/it, v_num=tif6, train/loss=3.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 229/10070 [06:34<4:42:43,  1.72s/it, v_num=tif6, train/loss=3.9\r",
-      "Epoch 0:   2%| | 229/10070 [06:34<4:42:43,  1.72s/it, v_num=tif6, train/loss=2.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 230/10070 [06:35<4:41:56,  1.72s/it, v_num=tif6, train/loss=2.6\r",
-      "Epoch 0:   2%| | 230/10070 [06:35<4:41:56,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 231/10070 [06:37<4:41:53,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   2%| | 231/10070 [06:37<4:41:53,  1.72s/it, v_num=tif6, train/loss=3.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 232/10070 [06:38<4:41:51,  1.72s/it, v_num=tif6, train/loss=3.4\r",
-      "Epoch 0:   2%| | 232/10070 [06:38<4:41:51,  1.72s/it, v_num=tif6, train/loss=4.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 233/10070 [06:39<4:41:05,  1.71s/it, v_num=tif6, train/loss=4.1\r",
-      "Epoch 0:   2%| | 233/10070 [06:39<4:41:05,  1.71s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 234/10070 [06:41<4:41:25,  1.72s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   2%| | 234/10070 [06:41<4:41:25,  1.72s/it, v_num=tif6, train/loss=5.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 235/10070 [06:42<4:41:02,  1.71s/it, v_num=tif6, train/loss=5.3\r",
-      "Epoch 0:   2%| | 235/10070 [06:42<4:41:02,  1.71s/it, v_num=tif6, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 236/10070 [06:44<4:40:39,  1.71s/it, v_num=tif6, train/loss=0.9\r",
-      "Epoch 0:   2%| | 236/10070 [06:44<4:40:39,  1.71s/it, v_num=tif6, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 237/10070 [06:46<4:40:59,  1.71s/it, v_num=tif6, train/loss=2.1\r",
-      "Epoch 0:   2%| | 237/10070 [06:46<4:40:59,  1.71s/it, v_num=tif6, train/loss=5.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 238/10070 [06:47<4:40:14,  1.71s/it, v_num=tif6, train/loss=5.5\r",
-      "Epoch 0:   2%| | 238/10070 [06:47<4:40:14,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 239/10070 [06:48<4:40:12,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   2%| | 239/10070 [06:48<4:40:12,  1.71s/it, v_num=tif6, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 240/10070 [06:50<4:40:33,  1.71s/it, v_num=tif6, train/loss=2.5\r",
-      "Epoch 0:   2%| | 240/10070 [06:50<4:40:33,  1.71s/it, v_num=tif6, train/loss=5.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 241/10070 [06:51<4:39:49,  1.71s/it, v_num=tif6, train/loss=5.7\r",
-      "Epoch 0:   2%| | 241/10070 [06:51<4:39:49,  1.71s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 242/10070 [06:52<4:39:05,  1.70s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   2%| | 242/10070 [06:52<4:39:05,  1.70s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 243/10070 [06:53<4:38:42,  1.70s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   2%| | 243/10070 [06:53<4:38:42,  1.70s/it, v_num=tif6, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 244/10070 [06:55<4:39:02,  1.70s/it, v_num=tif6, train/loss=0.9\r",
-      "Epoch 0:   2%| | 244/10070 [06:55<4:39:02,  1.70s/it, v_num=tif6, train/loss=4.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 245/10070 [06:58<4:39:24,  1.71s/it, v_num=tif6, train/loss=4.5\r",
-      "Epoch 0:   2%| | 245/10070 [06:58<4:39:24,  1.71s/it, v_num=tif6, train/loss=4.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 246/10070 [06:58<4:38:42,  1.70s/it, v_num=tif6, train/loss=4.9\r",
-      "Epoch 0:   2%| | 246/10070 [06:58<4:38:42,  1.70s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 247/10070 [07:00<4:39:01,  1.70s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   2%| | 247/10070 [07:00<4:39:01,  1.70s/it, v_num=tif6, train/loss=5.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 248/10070 [07:03<4:39:22,  1.71s/it, v_num=tif6, train/loss=5.6\r",
-      "Epoch 0:   2%| | 248/10070 [07:03<4:39:23,  1.71s/it, v_num=tif6, train/loss=5.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 249/10070 [07:04<4:39:01,  1.70s/it, v_num=tif6, train/loss=5.5\r",
-      "Epoch 0:   2%| | 249/10070 [07:04<4:39:01,  1.70s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 250/10070 [07:05<4:38:19,  1.70s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   2%| | 250/10070 [07:05<4:38:19,  1.70s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   2%| | 251/10070 [07:06<4:37:57,  1.70s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   2%| | 251/10070 [07:06<4:37:57,  1.70s/it, v_num=tif6, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 252/10070 [07:07<4:37:37,  1.70s/it, v_num=tif6, train/loss=1.1\r",
-      "Epoch 0:   3%| | 252/10070 [07:07<4:37:37,  1.70s/it, v_num=tif6, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 253/10070 [07:08<4:36:56,  1.69s/it, v_num=tif6, train/loss=1.2\r",
-      "Epoch 0:   3%| | 253/10070 [07:08<4:36:56,  1.69s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 254/10070 [07:10<4:37:15,  1.69s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   3%| | 254/10070 [07:10<4:37:15,  1.69s/it, v_num=tif6, train/loss=4.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 255/10070 [07:11<4:36:35,  1.69s/it, v_num=tif6, train/loss=4.5\r",
-      "Epoch 0:   3%| | 255/10070 [07:11<4:36:35,  1.69s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 256/10070 [07:22<4:42:51,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   3%| | 256/10070 [07:22<4:42:51,  1.73s/it, v_num=tif6, train/loss=5.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 257/10070 [07:23<4:42:09,  1.73s/it, v_num=tif6, train/loss=5.7\r",
-      "Epoch 0:   3%| | 257/10070 [07:23<4:42:09,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 258/10070 [07:24<4:41:47,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   3%| | 258/10070 [07:24<4:41:47,  1.72s/it, v_num=tif6, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 259/10070 [07:25<4:41:07,  1.72s/it, v_num=tif6, train/loss=0.9\r",
-      "Epoch 0:   3%| | 259/10070 [07:25<4:41:07,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 260/10070 [07:26<4:40:47,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   3%| | 260/10070 [07:26<4:40:47,  1.72s/it, v_num=tif6, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 261/10070 [07:27<4:40:26,  1.72s/it, v_num=tif6, train/loss=1.8\r",
-      "Epoch 0:   3%| | 261/10070 [07:27<4:40:27,  1.72s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 262/10070 [07:28<4:39:46,  1.71s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:   3%| | 262/10070 [07:28<4:39:46,  1.71s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 263/10070 [07:30<4:40:06,  1.71s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   3%| | 263/10070 [07:30<4:40:06,  1.71s/it, v_num=tif6, train/loss=4.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 264/10070 [07:31<4:39:45,  1.71s/it, v_num=tif6, train/loss=4.1\r",
-      "Epoch 0:   3%| | 264/10070 [07:31<4:39:45,  1.71s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 265/10070 [07:33<4:39:47,  1.71s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:   3%| | 265/10070 [07:33<4:39:47,  1.71s/it, v_num=tif6, train/loss=4.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 266/10070 [07:35<4:39:46,  1.71s/it, v_num=tif6, train/loss=4.0\r",
-      "Epoch 0:   3%| | 266/10070 [07:35<4:39:46,  1.71s/it, v_num=tif6, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 267/10070 [07:36<4:39:25,  1.71s/it, v_num=tif6, train/loss=3.2\r",
-      "Epoch 0:   3%| | 267/10070 [07:36<4:39:25,  1.71s/it, v_num=tif6, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 268/10070 [07:37<4:38:47,  1.71s/it, v_num=tif6, train/loss=1.0\r",
-      "Epoch 0:   3%| | 268/10070 [07:37<4:38:47,  1.71s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 269/10070 [07:39<4:39:07,  1.71s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   3%| | 269/10070 [07:39<4:39:07,  1.71s/it, v_num=tif6, train/loss=5.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 270/10070 [07:40<4:38:28,  1.70s/it, v_num=tif6, train/loss=5.1\r",
-      "Epoch 0:   3%| | 270/10070 [07:40<4:38:28,  1.70s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 271/10070 [07:42<4:38:48,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   3%| | 271/10070 [07:42<4:38:48,  1.71s/it, v_num=tif6, train/loss=4.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 272/10070 [07:43<4:38:09,  1.70s/it, v_num=tif6, train/loss=4.6\r",
-      "Epoch 0:   3%| | 272/10070 [07:43<4:38:09,  1.70s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 273/10070 [07:43<4:37:30,  1.70s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   3%| | 273/10070 [07:43<4:37:30,  1.70s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 274/10070 [07:46<4:37:47,  1.70s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   3%| | 274/10070 [07:46<4:37:47,  1.70s/it, v_num=tif6, train/loss=4.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 275/10070 [07:47<4:37:28,  1.70s/it, v_num=tif6, train/loss=4.1\r",
-      "Epoch 0:   3%| | 275/10070 [07:47<4:37:28,  1.70s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 276/10070 [07:49<4:37:27,  1.70s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   3%| | 276/10070 [07:49<4:37:27,  1.70s/it, v_num=tif6, train/loss=3.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 277/10070 [07:50<4:37:07,  1.70s/it, v_num=tif6, train/loss=3.9\r",
-      "Epoch 0:   3%| | 277/10070 [07:50<4:37:08,  1.70s/it, v_num=tif6, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 278/10070 [07:52<4:37:25,  1.70s/it, v_num=tif6, train/loss=0.8\r",
-      "Epoch 0:   3%| | 278/10070 [07:52<4:37:25,  1.70s/it, v_num=tif6, train/loss=5.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 279/10070 [07:53<4:36:47,  1.70s/it, v_num=tif6, train/loss=5.0\r",
-      "Epoch 0:   3%| | 279/10070 [07:53<4:36:47,  1.70s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 280/10070 [07:54<4:36:27,  1.69s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   3%| | 280/10070 [07:54<4:36:27,  1.69s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 281/10070 [07:56<4:36:47,  1.70s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   3%| | 281/10070 [07:56<4:36:47,  1.70s/it, v_num=tif6, train/loss=4.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 282/10070 [07:58<4:36:48,  1.70s/it, v_num=tif6, train/loss=4.3\r",
-      "Epoch 0:   3%| | 282/10070 [07:58<4:36:48,  1.70s/it, v_num=tif6, train/loss=3.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 283/10070 [07:59<4:36:11,  1.69s/it, v_num=tif6, train/loss=3.7\r",
-      "Epoch 0:   3%| | 283/10070 [07:59<4:36:11,  1.69s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 284/10070 [07:59<4:35:35,  1.69s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   3%| | 284/10070 [07:59<4:35:35,  1.69s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 285/10070 [08:01<4:35:16,  1.69s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   3%| | 285/10070 [08:01<4:35:16,  1.69s/it, v_num=tif6, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 286/10070 [08:03<4:35:35,  1.69s/it, v_num=tif6, train/loss=1.2\r",
-      "Epoch 0:   3%| | 286/10070 [08:03<4:35:35,  1.69s/it, v_num=tif6, train/loss=4.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 287/10070 [08:05<4:35:35,  1.69s/it, v_num=tif6, train/loss=4.3\r",
-      "Epoch 0:   3%| | 287/10070 [08:05<4:35:35,  1.69s/it, v_num=tif6, train/loss=3.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 288/10070 [08:16<4:40:52,  1.72s/it, v_num=tif6, train/loss=3.6\r",
-      "Epoch 0:   3%| | 288/10070 [08:16<4:40:52,  1.72s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 289/10070 [08:16<4:40:15,  1.72s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 289/10070 [08:16<4:40:15,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 290/10070 [08:19<4:40:33,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   3%| | 290/10070 [08:19<4:40:33,  1.72s/it, v_num=tif6, train/loss=5.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 291/10070 [08:20<4:40:32,  1.72s/it, v_num=tif6, train/loss=5.2\r",
-      "Epoch 0:   3%| | 291/10070 [08:20<4:40:32,  1.72s/it, v_num=tif6, train/loss=2.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 292/10070 [08:21<4:39:56,  1.72s/it, v_num=tif6, train/loss=2.4\r",
-      "Epoch 0:   3%| | 292/10070 [08:21<4:39:56,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 293/10070 [08:22<4:39:37,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   3%| | 293/10070 [08:22<4:39:37,  1.72s/it, v_num=tif6, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 294/10070 [08:23<4:39:18,  1.71s/it, v_num=tif6, train/loss=1.2\r",
-      "Epoch 0:   3%| | 294/10070 [08:23<4:39:18,  1.71s/it, v_num=tif6, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 295/10070 [08:24<4:38:41,  1.71s/it, v_num=tif6, train/loss=1.9\r",
-      "Epoch 0:   3%| | 295/10070 [08:24<4:38:41,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 296/10070 [08:26<4:38:39,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   3%| | 296/10070 [08:26<4:38:40,  1.71s/it, v_num=tif6, train/loss=2.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 297/10070 [08:27<4:38:22,  1.71s/it, v_num=tif6, train/loss=2.4\r",
-      "Epoch 0:   3%| | 297/10070 [08:27<4:38:22,  1.71s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 298/10070 [08:29<4:38:22,  1.71s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:   3%| | 298/10070 [08:29<4:38:22,  1.71s/it, v_num=tif6, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 299/10070 [08:30<4:38:03,  1.71s/it, v_num=tif6, train/loss=3.1\r",
-      "Epoch 0:   3%| | 299/10070 [08:30<4:38:04,  1.71s/it, v_num=tif6, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 300/10070 [08:32<4:38:20,  1.71s/it, v_num=tif6, train/loss=0.8\r",
-      "Epoch 0:   3%| | 300/10070 [08:32<4:38:21,  1.71s/it, v_num=tif6, train/loss=4.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 301/10070 [08:33<4:37:46,  1.71s/it, v_num=tif6, train/loss=4.0\r",
-      "Epoch 0:   3%| | 301/10070 [08:33<4:37:46,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 302/10070 [08:35<4:37:44,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   3%| | 302/10070 [08:35<4:37:44,  1.71s/it, v_num=tif6, train/loss=2.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 303/10070 [08:37<4:38:00,  1.71s/it, v_num=tif6, train/loss=2.9\r",
-      "Epoch 0:   3%| | 303/10070 [08:37<4:38:00,  1.71s/it, v_num=tif6, train/loss=5.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 304/10070 [08:38<4:37:43,  1.71s/it, v_num=tif6, train/loss=5.2\r",
-      "Epoch 0:   3%| | 304/10070 [08:38<4:37:43,  1.71s/it, v_num=tif6, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 305/10070 [08:39<4:37:25,  1.70s/it, v_num=tif6, train/loss=1.9\r",
-      "Epoch 0:   3%| | 305/10070 [08:39<4:37:25,  1.70s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 306/10070 [08:41<4:37:07,  1.70s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   3%| | 306/10070 [08:41<4:37:07,  1.70s/it, v_num=tif6, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 307/10070 [08:41<4:36:33,  1.70s/it, v_num=tif6, train/loss=0.9\r",
-      "Epoch 0:   3%| | 307/10070 [08:41<4:36:33,  1.70s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 308/10070 [08:43<4:36:34,  1.70s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   3%| | 308/10070 [08:43<4:36:34,  1.70s/it, v_num=tif6, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 309/10070 [08:45<4:36:51,  1.70s/it, v_num=tif6, train/loss=3.5\r",
-      "Epoch 0:   3%| | 309/10070 [08:45<4:36:51,  1.70s/it, v_num=tif6, train/loss=5.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 310/10070 [08:48<4:37:07,  1.70s/it, v_num=tif6, train/loss=5.3\r",
-      "Epoch 0:   3%| | 310/10070 [08:48<4:37:07,  1.70s/it, v_num=tif6, train/loss=4.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 311/10070 [08:50<4:37:24,  1.71s/it, v_num=tif6, train/loss=4.8\r",
-      "Epoch 0:   3%| | 311/10070 [08:50<4:37:24,  1.71s/it, v_num=tif6, train/loss=5.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 312/10070 [08:52<4:37:39,  1.71s/it, v_num=tif6, train/loss=5.3\r",
-      "Epoch 0:   3%| | 312/10070 [08:52<4:37:39,  1.71s/it, v_num=tif6, train/loss=4.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 313/10070 [08:53<4:37:23,  1.71s/it, v_num=tif6, train/loss=4.0\r",
-      "Epoch 0:   3%| | 313/10070 [08:53<4:37:23,  1.71s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 314/10070 [08:56<4:37:39,  1.71s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   3%| | 314/10070 [08:56<4:37:39,  1.71s/it, v_num=tif6, train/loss=5.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 315/10070 [08:56<4:37:06,  1.70s/it, v_num=tif6, train/loss=5.0\r",
-      "Epoch 0:   3%| | 315/10070 [08:56<4:37:06,  1.70s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 316/10070 [08:58<4:37:05,  1.70s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   3%| | 316/10070 [08:58<4:37:05,  1.70s/it, v_num=tif6, train/loss=2.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 317/10070 [08:59<4:36:49,  1.70s/it, v_num=tif6, train/loss=2.4\r",
-      "Epoch 0:   3%| | 317/10070 [08:59<4:36:49,  1.70s/it, v_num=tif6, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 318/10070 [09:01<4:36:32,  1.70s/it, v_num=tif6, train/loss=0.8\r",
-      "Epoch 0:   3%| | 318/10070 [09:01<4:36:32,  1.70s/it, v_num=tif6, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 319/10070 [09:01<4:36:00,  1.70s/it, v_num=tif6, train/loss=1.6\r",
-      "Epoch 0:   3%| | 319/10070 [09:01<4:36:00,  1.70s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 320/10070 [09:09<4:39:12,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   3%| | 320/10070 [09:09<4:39:12,  1.72s/it, v_num=tif6, train/loss=4.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 321/10070 [09:10<4:38:38,  1.71s/it, v_num=tif6, train/loss=4.5\r",
-      "Epoch 0:   3%| | 321/10070 [09:10<4:38:38,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 322/10070 [09:12<4:38:37,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   3%| | 322/10070 [09:12<4:38:37,  1.72s/it, v_num=tif6, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 323/10070 [09:12<4:38:05,  1.71s/it, v_num=tif6, train/loss=3.1\r",
-      "Epoch 0:   3%| | 323/10070 [09:12<4:38:05,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 324/10070 [09:15<4:38:21,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   3%| | 324/10070 [09:15<4:38:21,  1.71s/it, v_num=tif6, train/loss=4.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 325/10070 [09:15<4:37:48,  1.71s/it, v_num=tif6, train/loss=4.8\r",
-      "Epoch 0:   3%| | 325/10070 [09:15<4:37:48,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 326/10070 [09:16<4:37:17,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   3%| | 326/10070 [09:16<4:37:17,  1.71s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 327/10070 [09:18<4:37:33,  1.71s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   3%| | 327/10070 [09:18<4:37:33,  1.71s/it, v_num=tif6, train/loss=4.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 328/10070 [09:19<4:37:00,  1.71s/it, v_num=tif6, train/loss=4.7\r",
-      "Epoch 0:   3%| | 328/10070 [09:19<4:37:00,  1.71s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 329/10070 [09:20<4:36:44,  1.70s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   3%| | 329/10070 [09:20<4:36:44,  1.70s/it, v_num=tif6, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 330/10070 [09:21<4:36:12,  1.70s/it, v_num=tif6, train/loss=2.1\r",
-      "Epoch 0:   3%| | 330/10070 [09:21<4:36:12,  1.70s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 331/10070 [09:22<4:35:40,  1.70s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   3%| | 331/10070 [09:22<4:35:40,  1.70s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 332/10070 [09:24<4:35:56,  1.70s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   3%| | 332/10070 [09:24<4:35:56,  1.70s/it, v_num=tif6, train/loss=3.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 333/10070 [09:25<4:35:24,  1.70s/it, v_num=tif6, train/loss=3.9\r",
-      "Epoch 0:   3%| | 333/10070 [09:25<4:35:24,  1.70s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 334/10070 [09:26<4:35:08,  1.70s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   3%| | 334/10070 [09:26<4:35:08,  1.70s/it, v_num=tif6, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 335/10070 [09:27<4:34:37,  1.69s/it, v_num=tif6, train/loss=1.9\r",
-      "Epoch 0:   3%| | 335/10070 [09:27<4:34:37,  1.69s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 336/10070 [09:28<4:34:37,  1.69s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   3%| | 336/10070 [09:28<4:34:37,  1.69s/it, v_num=tif6, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 337/10070 [09:30<4:34:36,  1.69s/it, v_num=tif6, train/loss=3.1\r",
-      "Epoch 0:   3%| | 337/10070 [09:30<4:34:36,  1.69s/it, v_num=tif6, train/loss=3.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 338/10070 [09:31<4:34:21,  1.69s/it, v_num=tif6, train/loss=3.0\r",
-      "Epoch 0:   3%| | 338/10070 [09:31<4:34:21,  1.69s/it, v_num=tif6, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 339/10070 [09:34<4:34:37,  1.69s/it, v_num=tif6, train/loss=2.0\r",
-      "Epoch 0:   3%| | 339/10070 [09:34<4:34:37,  1.69s/it, v_num=tif6, train/loss=4.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 340/10070 [09:34<4:34:07,  1.69s/it, v_num=tif6, train/loss=4.9\r",
-      "Epoch 0:   3%| | 340/10070 [09:34<4:34:07,  1.69s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 341/10070 [09:36<4:34:22,  1.69s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   3%| | 341/10070 [09:36<4:34:22,  1.69s/it, v_num=tif6, train/loss=4.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 342/10070 [09:37<4:33:51,  1.69s/it, v_num=tif6, train/loss=4.5\r",
-      "Epoch 0:   3%| | 342/10070 [09:37<4:33:51,  1.69s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 343/10070 [09:39<4:34:07,  1.69s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   3%| | 343/10070 [09:39<4:34:07,  1.69s/it, v_num=tif6, train/loss=5.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 344/10070 [09:41<4:33:52,  1.69s/it, v_num=tif6, train/loss=5.1\r",
-      "Epoch 0:   3%| | 344/10070 [09:41<4:33:52,  1.69s/it, v_num=tif6, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 345/10070 [09:41<4:33:22,  1.69s/it, v_num=tif6, train/loss=1.5\r",
-      "Epoch 0:   3%| | 345/10070 [09:41<4:33:22,  1.69s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 346/10070 [09:44<4:33:37,  1.69s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   3%| | 346/10070 [09:44<4:33:37,  1.69s/it, v_num=tif6, train/loss=4.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 347/10070 [09:46<4:33:52,  1.69s/it, v_num=tif6, train/loss=4.4\r",
-      "Epoch 0:   3%| | 347/10070 [09:46<4:33:52,  1.69s/it, v_num=tif6, train/loss=5.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 348/10070 [09:47<4:33:37,  1.69s/it, v_num=tif6, train/loss=5.2\r",
-      "Epoch 0:   3%| | 348/10070 [09:47<4:33:37,  1.69s/it, v_num=tif6, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 349/10070 [09:48<4:33:07,  1.69s/it, v_num=tif6, train/loss=0.8\r",
-      "Epoch 0:   3%| | 349/10070 [09:48<4:33:07,  1.69s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 350/10070 [09:49<4:32:38,  1.68s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   3%| | 350/10070 [09:49<4:32:38,  1.68s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 351/10070 [09:50<4:32:38,  1.68s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   3%| | 351/10070 [09:50<4:32:38,  1.68s/it, v_num=tif6, train/loss=2.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   3%| | 352/10070 [10:09<4:40:15,  1.73s/it, v_num=tif6, train/loss=2.3\r",
-      "Epoch 0:   3%| | 352/10070 [10:09<4:40:15,  1.73s/it, v_num=tif6, train/loss=4.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 353/10070 [10:09<4:39:45,  1.73s/it, v_num=tif6, train/loss=4.6\r",
-      "Epoch 0:   4%| | 353/10070 [10:09<4:39:45,  1.73s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 354/10070 [10:11<4:39:30,  1.73s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   4%| | 354/10070 [10:11<4:39:30,  1.73s/it, v_num=tif6, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 355/10070 [10:12<4:39:29,  1.73s/it, v_num=tif6, train/loss=2.0\r",
-      "Epoch 0:   4%| | 355/10070 [10:12<4:39:30,  1.73s/it, v_num=tif6, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 356/10070 [10:13<4:39:00,  1.72s/it, v_num=tif6, train/loss=3.2\r",
-      "Epoch 0:   4%| | 356/10070 [10:13<4:39:00,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 357/10070 [10:14<4:38:44,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   4%| | 357/10070 [10:14<4:38:44,  1.72s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 358/10070 [10:16<4:38:44,  1.72s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   4%| | 358/10070 [10:16<4:38:44,  1.72s/it, v_num=tif6, train/loss=3.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 359/10070 [10:18<4:38:42,  1.72s/it, v_num=tif6, train/loss=3.6\r",
-      "Epoch 0:   4%| | 359/10070 [10:18<4:38:42,  1.72s/it, v_num=tif6, train/loss=2.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 360/10070 [10:19<4:38:40,  1.72s/it, v_num=tif6, train/loss=2.7\r",
-      "Epoch 0:   4%| | 360/10070 [10:19<4:38:40,  1.72s/it, v_num=tif6, train/loss=2.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 361/10070 [10:21<4:38:38,  1.72s/it, v_num=tif6, train/loss=2.4\r",
-      "Epoch 0:   4%| | 361/10070 [10:21<4:38:38,  1.72s/it, v_num=tif6, train/loss=3.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 362/10070 [10:23<4:38:37,  1.72s/it, v_num=tif6, train/loss=3.7\r",
-      "Epoch 0:   4%| | 362/10070 [10:23<4:38:37,  1.72s/it, v_num=tif6, train/loss=3.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 363/10070 [10:24<4:38:08,  1.72s/it, v_num=tif6, train/loss=3.0\r",
-      "Epoch 0:   4%| | 363/10070 [10:24<4:38:08,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 364/10070 [10:25<4:38:07,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 364/10070 [10:25<4:38:07,  1.72s/it, v_num=tif6, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 365/10070 [10:26<4:37:37,  1.72s/it, v_num=tif6, train/loss=3.2\r",
-      "Epoch 0:   4%| | 365/10070 [10:26<4:37:37,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 366/10070 [10:28<4:37:35,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 366/10070 [10:28<4:37:35,  1.72s/it, v_num=tif6, train/loss=2.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 367/10070 [10:29<4:37:34,  1.72s/it, v_num=tif6, train/loss=2.6\r",
-      "Epoch 0:   4%| | 367/10070 [10:29<4:37:34,  1.72s/it, v_num=tif6, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 368/10070 [10:31<4:37:19,  1.72s/it, v_num=tif6, train/loss=2.2\r",
-      "Epoch 0:   4%| | 368/10070 [10:31<4:37:19,  1.72s/it, v_num=tif6, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 369/10070 [10:32<4:37:04,  1.71s/it, v_num=tif6, train/loss=1.3\r",
-      "Epoch 0:   4%| | 369/10070 [10:32<4:37:04,  1.71s/it, v_num=tif6, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 370/10070 [10:34<4:37:02,  1.71s/it, v_num=tif6, train/loss=0.7\r",
-      "Epoch 0:   4%| | 370/10070 [10:34<4:37:03,  1.71s/it, v_num=tif6, train/loss=3.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 371/10070 [10:34<4:36:34,  1.71s/it, v_num=tif6, train/loss=3.0\r",
-      "Epoch 0:   4%| | 371/10070 [10:34<4:36:34,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 372/10070 [10:37<4:36:47,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 372/10070 [10:37<4:36:47,  1.71s/it, v_num=tif6, train/loss=4.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 373/10070 [10:39<4:37:01,  1.71s/it, v_num=tif6, train/loss=4.0\r",
-      "Epoch 0:   4%| | 373/10070 [10:39<4:37:01,  1.71s/it, v_num=tif6, train/loss=4.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 374/10070 [10:41<4:37:00,  1.71s/it, v_num=tif6, train/loss=4.5\r",
-      "Epoch 0:   4%| | 374/10070 [10:41<4:37:00,  1.71s/it, v_num=tif6, train/loss=2.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 375/10070 [10:42<4:36:59,  1.71s/it, v_num=tif6, train/loss=2.7\r",
-      "Epoch 0:   4%| | 375/10070 [10:42<4:36:59,  1.71s/it, v_num=tif6, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 376/10070 [10:44<4:36:44,  1.71s/it, v_num=tif6, train/loss=3.5\r",
-      "Epoch 0:   4%| | 376/10070 [10:44<4:36:44,  1.71s/it, v_num=tif6, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 377/10070 [10:44<4:36:15,  1.71s/it, v_num=tif6, train/loss=1.3\r",
-      "Epoch 0:   4%| | 377/10070 [10:44<4:36:15,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 378/10070 [10:47<4:36:29,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 378/10070 [10:47<4:36:29,  1.71s/it, v_num=tif6, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 379/10070 [10:48<4:36:16,  1.71s/it, v_num=tif6, train/loss=3.3\r",
-      "Epoch 0:   4%| | 379/10070 [10:48<4:36:16,  1.71s/it, v_num=tif6, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 380/10070 [10:48<4:35:49,  1.71s/it, v_num=tif6, train/loss=1.7\r",
-      "Epoch 0:   4%| | 380/10070 [10:48<4:35:49,  1.71s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 381/10070 [10:49<4:35:21,  1.71s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   4%| | 381/10070 [10:49<4:35:21,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 382/10070 [10:51<4:35:35,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 382/10070 [10:51<4:35:35,  1.71s/it, v_num=tif6, train/loss=4.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 383/10070 [10:53<4:35:22,  1.71s/it, v_num=tif6, train/loss=4.8\r",
-      "Epoch 0:   4%| | 383/10070 [10:53<4:35:22,  1.71s/it, v_num=tif6, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 384/10070 [11:02<4:38:29,  1.73s/it, v_num=tif6, train/loss=1.7\r",
-      "Epoch 0:   4%| | 384/10070 [11:02<4:38:29,  1.73s/it, v_num=tif6, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 385/10070 [11:03<4:38:14,  1.72s/it, v_num=tif6, train/loss=0.7\r",
-      "Epoch 0:   4%| | 385/10070 [11:03<4:38:14,  1.72s/it, v_num=tif6, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 386/10070 [11:04<4:37:46,  1.72s/it, v_num=tif6, train/loss=1.4\r",
-      "Epoch 0:   4%| | 386/10070 [11:04<4:37:46,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 387/10070 [11:05<4:37:30,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 387/10070 [11:05<4:37:30,  1.72s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 388/10070 [11:06<4:37:02,  1.72s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   4%| | 388/10070 [11:06<4:37:02,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 389/10070 [11:07<4:37:03,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 389/10070 [11:07<4:37:03,  1.72s/it, v_num=tif6, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 390/10070 [11:08<4:36:35,  1.71s/it, v_num=tif6, train/loss=3.2\r",
-      "Epoch 0:   4%| | 390/10070 [11:08<4:36:35,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 391/10070 [11:10<4:36:35,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 391/10070 [11:10<4:36:35,  1.71s/it, v_num=tif6, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 392/10070 [11:11<4:36:08,  1.71s/it, v_num=tif6, train/loss=3.1\r",
-      "Epoch 0:   4%| | 392/10070 [11:11<4:36:08,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 393/10070 [11:11<4:35:41,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 393/10070 [11:11<4:35:41,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 394/10070 [11:14<4:35:55,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 394/10070 [11:14<4:35:55,  1.71s/it, v_num=tif6, train/loss=4.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 395/10070 [11:15<4:35:54,  1.71s/it, v_num=tif6, train/loss=4.7\r",
-      "Epoch 0:   4%| | 395/10070 [11:15<4:35:54,  1.71s/it, v_num=tif6, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 396/10070 [11:16<4:35:27,  1.71s/it, v_num=tif6, train/loss=3.2\r",
-      "Epoch 0:   4%| | 396/10070 [11:16<4:35:27,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 397/10070 [11:17<4:35:01,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 397/10070 [11:17<4:35:01,  1.71s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 398/10070 [11:18<4:34:47,  1.70s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   4%| | 398/10070 [11:18<4:34:47,  1.70s/it, v_num=tif6, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 399/10070 [11:19<4:34:20,  1.70s/it, v_num=tif6, train/loss=1.4\r",
-      "Epoch 0:   4%| | 399/10070 [11:19<4:34:20,  1.70s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 400/10070 [11:19<4:33:54,  1.70s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 400/10070 [11:19<4:33:54,  1.70s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 401/10070 [11:20<4:33:28,  1.70s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   4%| | 401/10070 [11:20<4:33:28,  1.70s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 402/10070 [11:23<4:34:00,  1.70s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   4%| | 402/10070 [11:23<4:34:00,  1.70s/it, v_num=tif6, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 403/10070 [11:24<4:33:34,  1.70s/it, v_num=tif6, train/loss=1.6\r",
-      "Epoch 0:   4%| | 403/10070 [11:24<4:33:34,  1.70s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 404/10070 [11:24<4:33:08,  1.70s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   4%| | 404/10070 [11:24<4:33:08,  1.70s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 405/10070 [11:26<4:32:55,  1.69s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 405/10070 [11:26<4:32:55,  1.69s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 406/10070 [11:26<4:32:29,  1.69s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   4%| | 406/10070 [11:26<4:32:29,  1.69s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 407/10070 [11:28<4:32:30,  1.69s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 407/10070 [11:28<4:32:30,  1.69s/it, v_num=tif6, train/loss=2.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 408/10070 [11:29<4:32:05,  1.69s/it, v_num=tif6, train/loss=2.8\r",
-      "Epoch 0:   4%| | 408/10070 [11:29<4:32:05,  1.69s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 409/10070 [11:31<4:32:17,  1.69s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 409/10070 [11:31<4:32:17,  1.69s/it, v_num=tif6, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 410/10070 [11:32<4:31:51,  1.69s/it, v_num=tif6, train/loss=3.5\r",
-      "Epoch 0:   4%| | 410/10070 [11:32<4:31:51,  1.69s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 411/10070 [11:33<4:31:26,  1.69s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 411/10070 [11:33<4:31:26,  1.69s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 412/10070 [11:34<4:31:26,  1.69s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 412/10070 [11:34<4:31:26,  1.69s/it, v_num=tif6, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 413/10070 [11:37<4:31:39,  1.69s/it, v_num=tif6, train/loss=1.9\r",
-      "Epoch 0:   4%| | 413/10070 [11:37<4:31:39,  1.69s/it, v_num=tif6, train/loss=4.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 414/10070 [11:37<4:31:14,  1.69s/it, v_num=tif6, train/loss=4.3\r",
-      "Epoch 0:   4%| | 414/10070 [11:37<4:31:14,  1.69s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 415/10070 [11:38<4:30:49,  1.68s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 415/10070 [11:38<4:30:49,  1.68s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 416/10070 [11:59<4:38:15,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 416/10070 [11:59<4:38:15,  1.73s/it, v_num=tif6, train/loss=3.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 417/10070 [12:00<4:38:02,  1.73s/it, v_num=tif6, train/loss=3.9\r",
-      "Epoch 0:   4%| | 417/10070 [12:00<4:38:02,  1.73s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 418/10070 [12:02<4:38:13,  1.73s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   4%| | 418/10070 [12:02<4:38:13,  1.73s/it, v_num=tif6, train/loss=4.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 419/10070 [12:05<4:38:25,  1.73s/it, v_num=tif6, train/loss=4.2\r",
-      "Epoch 0:   4%| | 419/10070 [12:05<4:38:25,  1.73s/it, v_num=tif6, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 420/10070 [12:07<4:38:38,  1.73s/it, v_num=tif6, train/loss=3.3\r",
-      "Epoch 0:   4%| | 420/10070 [12:07<4:38:38,  1.73s/it, v_num=tif6, train/loss=4.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 421/10070 [12:08<4:38:13,  1.73s/it, v_num=tif6, train/loss=4.1\r",
-      "Epoch 0:   4%| | 421/10070 [12:08<4:38:13,  1.73s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 422/10070 [12:10<4:38:24,  1.73s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   4%| | 422/10070 [12:10<4:38:24,  1.73s/it, v_num=tif6, train/loss=4.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 423/10070 [12:12<4:38:35,  1.73s/it, v_num=tif6, train/loss=4.3\r",
-      "Epoch 0:   4%| | 423/10070 [12:12<4:38:35,  1.73s/it, v_num=tif6, train/loss=3.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 424/10070 [12:13<4:38:10,  1.73s/it, v_num=tif6, train/loss=3.7\r",
-      "Epoch 0:   4%| | 424/10070 [12:13<4:38:10,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 425/10070 [12:15<4:38:20,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 425/10070 [12:15<4:38:20,  1.73s/it, v_num=tif6, train/loss=3.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 426/10070 [12:17<4:38:14,  1.73s/it, v_num=tif6, train/loss=3.6\r",
-      "Epoch 0:   4%| | 426/10070 [12:17<4:38:14,  1.73s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 427/10070 [12:19<4:38:26,  1.73s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   4%| | 427/10070 [12:19<4:38:26,  1.73s/it, v_num=tif6, train/loss=4.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 428/10070 [12:20<4:38:01,  1.73s/it, v_num=tif6, train/loss=4.3\r",
-      "Epoch 0:   4%| | 428/10070 [12:20<4:38:01,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 429/10070 [12:21<4:37:47,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 429/10070 [12:21<4:37:47,  1.73s/it, v_num=tif6, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 430/10070 [12:22<4:37:35,  1.73s/it, v_num=tif6, train/loss=0.9\r",
-      "Epoch 0:   4%| | 430/10070 [12:22<4:37:35,  1.73s/it, v_num=tif6, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 431/10070 [12:25<4:37:46,  1.73s/it, v_num=tif6, train/loss=0.9\r",
-      "Epoch 0:   4%| | 431/10070 [12:25<4:37:46,  1.73s/it, v_num=tif6, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 432/10070 [12:26<4:37:45,  1.73s/it, v_num=tif6, train/loss=3.5\r",
-      "Epoch 0:   4%| | 432/10070 [12:26<4:37:45,  1.73s/it, v_num=tif6, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 433/10070 [12:28<4:37:44,  1.73s/it, v_num=tif6, train/loss=1.8\r",
-      "Epoch 0:   4%| | 433/10070 [12:28<4:37:44,  1.73s/it, v_num=tif6, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 434/10070 [12:29<4:37:31,  1.73s/it, v_num=tif6, train/loss=1.8\r",
-      "Epoch 0:   4%| | 434/10070 [12:29<4:37:31,  1.73s/it, v_num=tif6, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 435/10070 [12:31<4:37:29,  1.73s/it, v_num=tif6, train/loss=1.3\r",
-      "Epoch 0:   4%| | 435/10070 [12:31<4:37:29,  1.73s/it, v_num=tif6, train/loss=2.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 436/10070 [12:32<4:37:04,  1.73s/it, v_num=tif6, train/loss=2.8\r",
-      "Epoch 0:   4%| | 436/10070 [12:32<4:37:04,  1.73s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 437/10070 [12:33<4:36:51,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   4%| | 437/10070 [12:33<4:36:51,  1.72s/it, v_num=tif6, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 438/10070 [12:34<4:36:27,  1.72s/it, v_num=tif6, train/loss=1.4\r",
-      "Epoch 0:   4%| | 438/10070 [12:34<4:36:27,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 439/10070 [12:35<4:36:13,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 439/10070 [12:35<4:36:13,  1.72s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 440/10070 [12:37<4:36:12,  1.72s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:   4%| | 440/10070 [12:37<4:36:12,  1.72s/it, v_num=tif6, train/loss=2.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 441/10070 [12:37<4:35:48,  1.72s/it, v_num=tif6, train/loss=2.9\r",
-      "Epoch 0:   4%| | 441/10070 [12:37<4:35:48,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 442/10070 [12:40<4:35:58,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 442/10070 [12:40<4:35:58,  1.72s/it, v_num=tif6, train/loss=3.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 443/10070 [12:41<4:35:58,  1.72s/it, v_num=tif6, train/loss=3.7\r",
-      "Epoch 0:   4%| | 443/10070 [12:41<4:35:58,  1.72s/it, v_num=tif6, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 444/10070 [12:43<4:35:57,  1.72s/it, v_num=tif6, train/loss=2.5\r",
-      "Epoch 0:   4%| | 444/10070 [12:43<4:35:57,  1.72s/it, v_num=tif6, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 445/10070 [12:44<4:35:33,  1.72s/it, v_num=tif6, train/loss=2.2\r",
-      "Epoch 0:   4%| | 445/10070 [12:44<4:35:33,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 446/10070 [12:45<4:35:20,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 446/10070 [12:45<4:35:20,  1.72s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 447/10070 [12:46<4:34:56,  1.71s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   4%| | 447/10070 [12:46<4:34:56,  1.71s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 448/10070 [12:52<4:36:36,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   4%| | 448/10070 [12:52<4:36:36,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 449/10070 [12:53<4:36:24,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   4%| | 449/10070 [12:53<4:36:24,  1.72s/it, v_num=tif6, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 450/10070 [12:55<4:36:11,  1.72s/it, v_num=tif6, train/loss=0.4\r",
-      "Epoch 0:   4%| | 450/10070 [12:55<4:36:11,  1.72s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 451/10070 [12:57<4:36:23,  1.72s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   4%| | 451/10070 [12:57<4:36:23,  1.72s/it, v_num=tif6, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 452/10070 [12:58<4:35:59,  1.72s/it, v_num=tif6, train/loss=3.3\r",
-      "Epoch 0:   4%| | 452/10070 [12:58<4:35:59,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   4%| | 453/10070 [12:58<4:35:35,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   4%| | 453/10070 [12:58<4:35:35,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 454/10070 [13:00<4:35:23,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 454/10070 [13:00<4:35:23,  1.72s/it, v_num=tif6, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 455/10070 [13:02<4:35:34,  1.72s/it, v_num=tif6, train/loss=1.5\r",
-      "Epoch 0:   5%| | 455/10070 [13:02<4:35:34,  1.72s/it, v_num=tif6, train/loss=4.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 456/10070 [13:04<4:35:32,  1.72s/it, v_num=tif6, train/loss=4.6\r",
-      "Epoch 0:   5%| | 456/10070 [13:04<4:35:32,  1.72s/it, v_num=tif6, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 457/10070 [13:04<4:35:09,  1.72s/it, v_num=tif6, train/loss=1.6\r",
-      "Epoch 0:   5%| | 457/10070 [13:04<4:35:09,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 458/10070 [13:07<4:35:19,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 458/10070 [13:07<4:35:19,  1.72s/it, v_num=tif6, train/loss=4.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 459/10070 [13:09<4:35:28,  1.72s/it, v_num=tif6, train/loss=4.3\r",
-      "Epoch 0:   5%| | 459/10070 [13:09<4:35:28,  1.72s/it, v_num=tif6, train/loss=4.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 460/10070 [13:11<4:35:37,  1.72s/it, v_num=tif6, train/loss=4.2\r",
-      "Epoch 0:   5%| | 460/10070 [13:11<4:35:37,  1.72s/it, v_num=tif6, train/loss=4.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 461/10070 [13:12<4:35:25,  1.72s/it, v_num=tif6, train/loss=4.2\r",
-      "Epoch 0:   5%| | 461/10070 [13:12<4:35:25,  1.72s/it, v_num=tif6, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 462/10070 [13:14<4:35:13,  1.72s/it, v_num=tif6, train/loss=0.9\r",
-      "Epoch 0:   5%| | 462/10070 [13:14<4:35:13,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 463/10070 [13:15<4:35:01,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   5%| | 463/10070 [13:15<4:35:01,  1.72s/it, v_num=tif6, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 464/10070 [13:17<4:35:01,  1.72s/it, v_num=tif6, train/loss=1.2\r",
-      "Epoch 0:   5%| | 464/10070 [13:17<4:35:01,  1.72s/it, v_num=tif6, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 465/10070 [13:19<4:35:11,  1.72s/it, v_num=tif6, train/loss=1.8\r",
-      "Epoch 0:   5%| | 465/10070 [13:19<4:35:11,  1.72s/it, v_num=tif6, train/loss=3.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 466/10070 [13:21<4:35:09,  1.72s/it, v_num=tif6, train/loss=3.4\r",
-      "Epoch 0:   5%| | 466/10070 [13:21<4:35:09,  1.72s/it, v_num=tif6, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 467/10070 [13:21<4:34:46,  1.72s/it, v_num=tif6, train/loss=2.0\r",
-      "Epoch 0:   5%| | 467/10070 [13:21<4:34:46,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 468/10070 [13:24<4:34:56,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 468/10070 [13:24<4:34:56,  1.72s/it, v_num=tif6, train/loss=3.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 469/10070 [13:25<4:34:44,  1.72s/it, v_num=tif6, train/loss=3.8\r",
-      "Epoch 0:   5%| | 469/10070 [13:25<4:34:44,  1.72s/it, v_num=tif6, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 470/10070 [13:27<4:34:54,  1.72s/it, v_num=tif6, train/loss=1.2\r",
-      "Epoch 0:   5%| | 470/10070 [13:27<4:34:54,  1.72s/it, v_num=tif6, train/loss=3.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 471/10070 [13:28<4:34:32,  1.72s/it, v_num=tif6, train/loss=3.9\r",
-      "Epoch 0:   5%| | 471/10070 [13:28<4:34:32,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 472/10070 [13:30<4:34:42,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 472/10070 [13:30<4:34:42,  1.72s/it, v_num=tif6, train/loss=4.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 473/10070 [13:31<4:34:30,  1.72s/it, v_num=tif6, train/loss=4.4\r",
-      "Epoch 0:   5%| | 473/10070 [13:31<4:34:30,  1.72s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 474/10070 [13:32<4:34:08,  1.71s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:   5%| | 474/10070 [13:32<4:34:08,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 475/10070 [13:34<4:34:18,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 475/10070 [13:34<4:34:18,  1.72s/it, v_num=tif6, train/loss=3.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 476/10070 [13:37<4:34:28,  1.72s/it, v_num=tif6, train/loss=3.7\r",
-      "Epoch 0:   5%| | 476/10070 [13:37<4:34:28,  1.72s/it, v_num=tif6, train/loss=4.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 477/10070 [13:38<4:34:16,  1.72s/it, v_num=tif6, train/loss=4.2\r",
-      "Epoch 0:   5%| | 477/10070 [13:38<4:34:16,  1.72s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 478/10070 [13:39<4:34:04,  1.71s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:   5%| | 478/10070 [13:39<4:34:04,  1.71s/it, v_num=tif6, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 479/10070 [13:40<4:33:53,  1.71s/it, v_num=tif6, train/loss=0.9\r",
-      "Epoch 0:   5%| | 479/10070 [13:40<4:33:53,  1.71s/it, v_num=tif6, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 480/10070 [13:47<4:35:26,  1.72s/it, v_num=tif6, train/loss=1.1\r",
-      "Epoch 0:   5%| | 480/10070 [13:47<4:35:26,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 481/10070 [13:48<4:35:24,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 481/10070 [13:48<4:35:24,  1.72s/it, v_num=tif6, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 482/10070 [13:49<4:35:01,  1.72s/it, v_num=tif6, train/loss=1.6\r",
-      "Epoch 0:   5%| | 482/10070 [13:49<4:35:01,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 483/10070 [13:51<4:35:00,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 483/10070 [13:51<4:35:00,  1.72s/it, v_num=tif6, train/loss=2.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 484/10070 [13:52<4:34:38,  1.72s/it, v_num=tif6, train/loss=2.7\r",
-      "Epoch 0:   5%| | 484/10070 [13:52<4:34:38,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 485/10070 [13:53<4:34:27,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 485/10070 [13:53<4:34:27,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 486/10070 [13:55<4:34:37,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   5%| | 486/10070 [13:55<4:34:37,  1.72s/it, v_num=tif6, train/loss=4.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 487/10070 [13:57<4:34:47,  1.72s/it, v_num=tif6, train/loss=4.1\r",
-      "Epoch 0:   5%| | 487/10070 [13:57<4:34:47,  1.72s/it, v_num=tif6, train/loss=4.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 488/10070 [14:00<4:34:59,  1.72s/it, v_num=tif6, train/loss=4.5\r",
-      "Epoch 0:   5%| | 488/10070 [14:00<4:34:59,  1.72s/it, v_num=tif6, train/loss=3.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 489/10070 [14:00<4:34:36,  1.72s/it, v_num=tif6, train/loss=3.0\r",
-      "Epoch 0:   5%| | 489/10070 [14:00<4:34:36,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 490/10070 [14:02<4:34:36,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 490/10070 [14:02<4:34:36,  1.72s/it, v_num=tif6, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 491/10070 [14:03<4:34:14,  1.72s/it, v_num=tif6, train/loss=2.2\r",
-      "Epoch 0:   5%| | 491/10070 [14:03<4:34:14,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 492/10070 [14:05<4:34:24,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 492/10070 [14:05<4:34:24,  1.72s/it, v_num=tif6, train/loss=3.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 493/10070 [14:07<4:34:22,  1.72s/it, v_num=tif6, train/loss=3.0\r",
-      "Epoch 0:   5%| | 493/10070 [14:07<4:34:22,  1.72s/it, v_num=tif6, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 494/10070 [14:08<4:34:10,  1.72s/it, v_num=tif6, train/loss=1.4\r",
-      "Epoch 0:   5%| | 494/10070 [14:08<4:34:10,  1.72s/it, v_num=tif6, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 495/10070 [14:10<4:34:19,  1.72s/it, v_num=tif6, train/loss=0.4\r",
-      "Epoch 0:   5%| | 495/10070 [14:10<4:34:19,  1.72s/it, v_num=tif6, train/loss=4.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 496/10070 [14:13<4:34:30,  1.72s/it, v_num=tif6, train/loss=4.4\r",
-      "Epoch 0:   5%| | 496/10070 [14:13<4:34:30,  1.72s/it, v_num=tif6, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 497/10070 [14:14<4:34:28,  1.72s/it, v_num=tif6, train/loss=3.1\r",
-      "Epoch 0:   5%| | 497/10070 [14:14<4:34:28,  1.72s/it, v_num=tif6, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 498/10070 [14:16<4:34:16,  1.72s/it, v_num=tif6, train/loss=2.2\r",
-      "Epoch 0:   5%| | 498/10070 [14:16<4:34:16,  1.72s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 499/10070 [14:18<4:34:25,  1.72s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   5%| | 499/10070 [14:18<4:34:25,  1.72s/it, v_num=tif6, train/loss=4.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 500/10070 [14:19<4:34:03,  1.72s/it, v_num=tif6, train/loss=4.0\r",
-      "Epoch 0:   5%| | 500/10070 [14:19<4:34:03,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 501/10070 [14:21<4:34:12,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 501/10070 [14:21<4:34:12,  1.72s/it, v_num=tif6, train/loss=3.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 502/10070 [14:23<4:34:11,  1.72s/it, v_num=tif6, train/loss=3.9\r",
-      "Epoch 0:   5%| | 502/10070 [14:23<4:34:11,  1.72s/it, v_num=tif6, train/loss=2.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 503/10070 [14:24<4:34:00,  1.72s/it, v_num=tif6, train/loss=2.7\r",
-      "Epoch 0:   5%| | 503/10070 [14:24<4:34:00,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 504/10070 [14:26<4:34:10,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   5%| | 504/10070 [14:26<4:34:10,  1.72s/it, v_num=tif6, train/loss=4.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 505/10070 [14:27<4:33:59,  1.72s/it, v_num=tif6, train/loss=4.5\r",
-      "Epoch 0:   5%| | 505/10070 [14:27<4:33:59,  1.72s/it, v_num=tif6, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 506/10070 [14:30<4:34:08,  1.72s/it, v_num=tif6, train/loss=1.1\r",
-      "Epoch 0:   5%| | 506/10070 [14:30<4:34:08,  1.72s/it, v_num=tif6, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 507/10070 [14:30<4:33:47,  1.72s/it, v_num=tif6, train/loss=3.5\r",
-      "Epoch 0:   5%| | 507/10070 [14:30<4:33:47,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 508/10070 [14:32<4:33:35,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 508/10070 [14:32<4:33:35,  1.72s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 509/10070 [14:32<4:33:14,  1.71s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:   5%| | 509/10070 [14:32<4:33:14,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 510/10070 [14:34<4:33:14,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 510/10070 [14:34<4:33:14,  1.71s/it, v_num=tif6, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 511/10070 [14:35<4:32:53,  1.71s/it, v_num=tif6, train/loss=2.1\r",
-      "Epoch 0:   5%| | 511/10070 [14:35<4:32:53,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 512/10070 [14:43<4:34:50,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 512/10070 [14:43<4:34:50,  1.73s/it, v_num=tif6, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 513/10070 [14:45<4:35:00,  1.73s/it, v_num=tif6, train/loss=3.3\r",
-      "Epoch 0:   5%| | 513/10070 [14:45<4:35:00,  1.73s/it, v_num=tif6, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 514/10070 [14:46<4:34:39,  1.72s/it, v_num=tif6, train/loss=3.1\r",
-      "Epoch 0:   5%| | 514/10070 [14:46<4:34:39,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 515/10070 [14:48<4:34:48,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 515/10070 [14:48<4:34:48,  1.73s/it, v_num=tif6, train/loss=4.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 516/10070 [14:49<4:34:38,  1.72s/it, v_num=tif6, train/loss=4.5\r",
-      "Epoch 0:   5%| | 516/10070 [14:49<4:34:38,  1.72s/it, v_num=tif6, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 517/10070 [14:51<4:34:37,  1.72s/it, v_num=tif6, train/loss=0.4\r",
-      "Epoch 0:   5%| | 517/10070 [14:51<4:34:37,  1.72s/it, v_num=tif6, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 518/10070 [14:54<4:34:45,  1.73s/it, v_num=tif6, train/loss=1.8\r",
-      "Epoch 0:   5%| | 518/10070 [14:54<4:34:45,  1.73s/it, v_num=tif6, train/loss=3.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 519/10070 [14:54<4:34:25,  1.72s/it, v_num=tif6, train/loss=3.7\r",
-      "Epoch 0:   5%| | 519/10070 [14:54<4:34:25,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 520/10070 [14:55<4:34:13,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 520/10070 [14:55<4:34:13,  1.72s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 521/10070 [14:56<4:33:52,  1.72s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   5%| | 521/10070 [14:56<4:33:52,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 522/10070 [14:57<4:33:32,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 522/10070 [14:57<4:33:32,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 523/10070 [14:59<4:33:30,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 523/10070 [14:59<4:33:30,  1.72s/it, v_num=tif6, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 524/10070 [15:00<4:33:28,  1.72s/it, v_num=tif6, train/loss=1.6\r",
-      "Epoch 0:   5%| | 524/10070 [15:00<4:33:28,  1.72s/it, v_num=tif6, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 525/10070 [15:02<4:33:27,  1.72s/it, v_num=tif6, train/loss=1.7\r",
-      "Epoch 0:   5%| | 525/10070 [15:02<4:33:27,  1.72s/it, v_num=tif6, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 526/10070 [15:03<4:33:07,  1.72s/it, v_num=tif6, train/loss=2.5\r",
-      "Epoch 0:   5%| | 526/10070 [15:03<4:33:07,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 527/10070 [15:04<4:32:56,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 527/10070 [15:04<4:32:56,  1.72s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 528/10070 [15:05<4:32:46,  1.72s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   5%| | 528/10070 [15:05<4:32:46,  1.72s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 529/10070 [15:07<4:32:55,  1.72s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   5%| | 529/10070 [15:07<4:32:55,  1.72s/it, v_num=tif6, train/loss=4.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 530/10070 [15:10<4:33:04,  1.72s/it, v_num=tif6, train/loss=4.1\r",
-      "Epoch 0:   5%| | 530/10070 [15:10<4:33:04,  1.72s/it, v_num=tif6, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 531/10070 [15:12<4:33:03,  1.72s/it, v_num=tif6, train/loss=3.3\r",
-      "Epoch 0:   5%| | 531/10070 [15:12<4:33:03,  1.72s/it, v_num=tif6, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 532/10070 [15:13<4:32:52,  1.72s/it, v_num=tif6, train/loss=1.7\r",
-      "Epoch 0:   5%| | 532/10070 [15:13<4:32:52,  1.72s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 533/10070 [15:13<4:32:33,  1.71s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:   5%| | 533/10070 [15:13<4:32:33,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 534/10070 [15:16<4:32:41,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 534/10070 [15:16<4:32:41,  1.72s/it, v_num=tif6, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 535/10070 [15:17<4:32:30,  1.71s/it, v_num=tif6, train/loss=3.3\r",
-      "Epoch 0:   5%| | 535/10070 [15:17<4:32:30,  1.71s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 536/10070 [15:19<4:32:29,  1.71s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   5%| | 536/10070 [15:19<4:32:29,  1.71s/it, v_num=tif6, train/loss=2.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 537/10070 [15:19<4:32:09,  1.71s/it, v_num=tif6, train/loss=2.4\r",
-      "Epoch 0:   5%| | 537/10070 [15:19<4:32:09,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 538/10070 [15:21<4:32:07,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 538/10070 [15:21<4:32:07,  1.71s/it, v_num=tif6, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 539/10070 [15:22<4:31:48,  1.71s/it, v_num=tif6, train/loss=1.5\r",
-      "Epoch 0:   5%| | 539/10070 [15:22<4:31:48,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 540/10070 [15:23<4:31:37,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 540/10070 [15:23<4:31:37,  1.71s/it, v_num=tif6, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 541/10070 [15:24<4:31:27,  1.71s/it, v_num=tif6, train/loss=1.0\r",
-      "Epoch 0:   5%| | 541/10070 [15:24<4:31:27,  1.71s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 542/10070 [15:25<4:31:07,  1.71s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   5%| | 542/10070 [15:25<4:31:07,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 543/10070 [15:27<4:31:16,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 543/10070 [15:27<4:31:16,  1.71s/it, v_num=tif6, train/loss=4.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 544/10070 [15:35<4:32:57,  1.72s/it, v_num=tif6, train/loss=4.1\r",
-      "Epoch 0:   5%| | 544/10070 [15:35<4:32:57,  1.72s/it, v_num=tif6, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 545/10070 [15:37<4:32:56,  1.72s/it, v_num=tif6, train/loss=1.8\r",
-      "Epoch 0:   5%| | 545/10070 [15:37<4:32:56,  1.72s/it, v_num=tif6, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 546/10070 [15:38<4:32:46,  1.72s/it, v_num=tif6, train/loss=1.2\r",
-      "Epoch 0:   5%| | 546/10070 [15:38<4:32:46,  1.72s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 547/10070 [15:39<4:32:36,  1.72s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   5%| | 547/10070 [15:39<4:32:36,  1.72s/it, v_num=tif6, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 548/10070 [15:40<4:32:25,  1.72s/it, v_num=tif6, train/loss=0.9\r",
-      "Epoch 0:   5%| | 548/10070 [15:40<4:32:25,  1.72s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 549/10070 [15:41<4:32:06,  1.71s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   5%| | 549/10070 [15:41<4:32:06,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 550/10070 [15:43<4:32:04,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 550/10070 [15:43<4:32:04,  1.71s/it, v_num=tif6, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 551/10070 [15:43<4:31:45,  1.71s/it, v_num=tif6, train/loss=1.7\r",
-      "Epoch 0:   5%| | 551/10070 [15:43<4:31:45,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 552/10070 [15:45<4:31:43,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   5%| | 552/10070 [15:45<4:31:43,  1.71s/it, v_num=tif6, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   5%| | 553/10070 [15:46<4:31:24,  1.71s/it, v_num=tif6, train/loss=2.2\r",
-      "Epoch 0:   5%| | 553/10070 [15:46<4:31:24,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 554/10070 [15:48<4:31:31,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 554/10070 [15:48<4:31:31,  1.71s/it, v_num=tif6, train/loss=4.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 555/10070 [15:49<4:31:12,  1.71s/it, v_num=tif6, train/loss=4.2\r",
-      "Epoch 0:   6%| | 555/10070 [15:49<4:31:12,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 556/10070 [15:50<4:31:12,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 556/10070 [15:50<4:31:12,  1.71s/it, v_num=tif6, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 557/10070 [15:52<4:31:02,  1.71s/it, v_num=tif6, train/loss=1.4\r",
-      "Epoch 0:   6%| | 557/10070 [15:52<4:31:02,  1.71s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 558/10070 [15:54<4:31:11,  1.71s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   6%| | 558/10070 [15:54<4:31:11,  1.71s/it, v_num=tif6, train/loss=4.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 559/10070 [15:55<4:31:01,  1.71s/it, v_num=tif6, train/loss=4.0\r",
-      "Epoch 0:   6%| | 559/10070 [15:55<4:31:01,  1.71s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 560/10070 [15:57<4:30:52,  1.71s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:   6%| | 560/10070 [15:57<4:30:53,  1.71s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 561/10070 [15:58<4:30:43,  1.71s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   6%| | 561/10070 [15:58<4:30:43,  1.71s/it, v_num=tif6, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 562/10070 [15:58<4:30:24,  1.71s/it, v_num=tif6, train/loss=1.5\r",
-      "Epoch 0:   6%| | 562/10070 [15:58<4:30:24,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 563/10070 [16:00<4:30:23,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 563/10070 [16:00<4:30:23,  1.71s/it, v_num=tif6, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 564/10070 [16:01<4:30:13,  1.71s/it, v_num=tif6, train/loss=1.8\r",
-      "Epoch 0:   6%| | 564/10070 [16:01<4:30:13,  1.71s/it, v_num=tif6, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 565/10070 [16:03<4:30:12,  1.71s/it, v_num=tif6, train/loss=1.1\r",
-      "Epoch 0:   6%| | 565/10070 [16:03<4:30:12,  1.71s/it, v_num=tif6, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 566/10070 [16:05<4:30:20,  1.71s/it, v_num=tif6, train/loss=1.4\r",
-      "Epoch 0:   6%| | 566/10070 [16:05<4:30:20,  1.71s/it, v_num=tif6, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 567/10070 [16:07<4:30:10,  1.71s/it, v_num=tif6, train/loss=3.2\r",
-      "Epoch 0:   6%| | 567/10070 [16:07<4:30:10,  1.71s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 568/10070 [16:08<4:30:00,  1.71s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   6%| | 568/10070 [16:08<4:30:01,  1.71s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 569/10070 [16:10<4:30:08,  1.71s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   6%| | 569/10070 [16:10<4:30:08,  1.71s/it, v_num=tif6, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 570/10070 [16:12<4:30:08,  1.71s/it, v_num=tif6, train/loss=3.2\r",
-      "Epoch 0:   6%| | 570/10070 [16:12<4:30:08,  1.71s/it, v_num=tif6, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 571/10070 [16:13<4:29:58,  1.71s/it, v_num=tif6, train/loss=1.4\r",
-      "Epoch 0:   6%| | 571/10070 [16:13<4:29:58,  1.71s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 572/10070 [16:14<4:29:48,  1.70s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   6%| | 572/10070 [16:14<4:29:48,  1.70s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 573/10070 [16:16<4:29:38,  1.70s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   6%| | 573/10070 [16:16<4:29:38,  1.70s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 574/10070 [16:17<4:29:36,  1.70s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   6%| | 574/10070 [16:17<4:29:36,  1.70s/it, v_num=tif6, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 575/10070 [16:18<4:29:18,  1.70s/it, v_num=tif6, train/loss=1.6\r",
-      "Epoch 0:   6%| | 575/10070 [16:18<4:29:18,  1.70s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 576/10070 [16:29<4:31:48,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 576/10070 [16:29<4:31:48,  1.72s/it, v_num=tif6, train/loss=2.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 577/10070 [16:30<4:31:30,  1.72s/it, v_num=tif6, train/loss=2.3\r",
-      "Epoch 0:   6%| | 577/10070 [16:30<4:31:30,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 578/10070 [16:31<4:31:20,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 578/10070 [16:31<4:31:20,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 579/10070 [16:32<4:31:01,  1.71s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   6%| | 579/10070 [16:32<4:31:01,  1.71s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 580/10070 [16:34<4:31:09,  1.71s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   6%| | 580/10070 [16:34<4:31:09,  1.71s/it, v_num=tif6, train/loss=3.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 581/10070 [16:35<4:30:51,  1.71s/it, v_num=tif6, train/loss=3.8\r",
-      "Epoch 0:   6%| | 581/10070 [16:35<4:30:51,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 582/10070 [16:37<4:30:58,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 582/10070 [16:37<4:30:58,  1.71s/it, v_num=tif6, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 583/10070 [16:39<4:31:05,  1.71s/it, v_num=tif6, train/loss=3.5\r",
-      "Epoch 0:   6%| | 583/10070 [16:39<4:31:05,  1.71s/it, v_num=tif6, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 584/10070 [16:40<4:30:47,  1.71s/it, v_num=tif6, train/loss=3.2\r",
-      "Epoch 0:   6%| | 584/10070 [16:40<4:30:47,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 585/10070 [16:41<4:30:45,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 585/10070 [16:41<4:30:45,  1.71s/it, v_num=tif6, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 586/10070 [16:43<4:30:44,  1.71s/it, v_num=tif6, train/loss=1.5\r",
-      "Epoch 0:   6%| | 586/10070 [16:43<4:30:44,  1.71s/it, v_num=tif6, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 587/10070 [16:44<4:30:26,  1.71s/it, v_num=tif6, train/loss=2.5\r",
-      "Epoch 0:   6%| | 587/10070 [16:44<4:30:26,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 588/10070 [16:46<4:30:25,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 588/10070 [16:46<4:30:25,  1.71s/it, v_num=tif6, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 589/10070 [16:46<4:30:07,  1.71s/it, v_num=tif6, train/loss=1.8\r",
-      "Epoch 0:   6%| | 589/10070 [16:46<4:30:07,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 590/10070 [16:48<4:29:58,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 590/10070 [16:48<4:29:58,  1.71s/it, v_num=tif6, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 591/10070 [16:49<4:29:56,  1.71s/it, v_num=tif6, train/loss=0.4\r",
-      "Epoch 0:   6%| | 591/10070 [16:49<4:29:56,  1.71s/it, v_num=tif6, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 592/10070 [16:51<4:29:47,  1.71s/it, v_num=tif6, train/loss=1.6\r",
-      "Epoch 0:   6%| | 592/10070 [16:51<4:29:47,  1.71s/it, v_num=tif6, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 593/10070 [16:52<4:29:37,  1.71s/it, v_num=tif6, train/loss=1.1\r",
-      "Epoch 0:   6%| | 593/10070 [16:52<4:29:37,  1.71s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 594/10070 [16:53<4:29:28,  1.71s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   6%| | 594/10070 [16:53<4:29:28,  1.71s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 595/10070 [16:54<4:29:18,  1.71s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:   6%| | 595/10070 [16:54<4:29:18,  1.71s/it, v_num=tif6, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 596/10070 [16:55<4:29:01,  1.70s/it, v_num=tif6, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 596/10070 [16:55<4:29:01,  1.70s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 597/10070 [16:57<4:29:00,  1.70s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 597/10070 [16:57<4:29:00,  1.70s/it, v_num=tif6, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 598/10070 [16:58<4:29:00,  1.70s/it, v_num=tif6, train/loss=1.1\r",
-      "Epoch 0:   6%| | 598/10070 [16:58<4:29:00,  1.70s/it, v_num=tif6, train/loss=2.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 599/10070 [17:00<4:28:50,  1.70s/it, v_num=tif6, train/loss=2.6\r",
-      "Epoch 0:   6%| | 599/10070 [17:00<4:28:50,  1.70s/it, v_num=tif6, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 600/10070 [17:00<4:28:33,  1.70s/it, v_num=tif6, train/loss=0.8\r",
-      "Epoch 0:   6%| | 600/10070 [17:00<4:28:33,  1.70s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 601/10070 [17:03<4:28:40,  1.70s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   6%| | 601/10070 [17:03<4:28:40,  1.70s/it, v_num=tif6, train/loss=3.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 602/10070 [17:04<4:28:39,  1.70s/it, v_num=tif6, train/loss=3.8\r",
-      "Epoch 0:   6%| | 602/10070 [17:04<4:28:39,  1.70s/it, v_num=tif6, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 603/10070 [17:06<4:28:29,  1.70s/it, v_num=tif6, train/loss=1.1\r",
-      "Epoch 0:   6%| | 603/10070 [17:06<4:28:29,  1.70s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 604/10070 [17:06<4:28:11,  1.70s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   6%| | 604/10070 [17:06<4:28:11,  1.70s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 605/10070 [17:08<4:28:10,  1.70s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 605/10070 [17:08<4:28:10,  1.70s/it, v_num=tif6, train/loss=2.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 606/10070 [17:09<4:27:53,  1.70s/it, v_num=tif6, train/loss=2.8\r",
-      "Epoch 0:   6%| | 606/10070 [17:09<4:27:53,  1.70s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 607/10070 [17:10<4:27:43,  1.70s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 607/10070 [17:10<4:27:43,  1.70s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 608/10070 [17:30<4:32:26,  1.73s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 608/10070 [17:30<4:32:26,  1.73s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 609/10070 [17:31<4:32:08,  1.73s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:   6%| | 609/10070 [17:31<4:32:08,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 610/10070 [17:33<4:32:15,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 610/10070 [17:33<4:32:15,  1.73s/it, v_num=tif6, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 611/10070 [17:35<4:32:14,  1.73s/it, v_num=tif6, train/loss=3.1\r",
-      "Epoch 0:   6%| | 611/10070 [17:35<4:32:14,  1.73s/it, v_num=tif6, train/loss=2.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 612/10070 [17:37<4:32:22,  1.73s/it, v_num=tif6, train/loss=2.3\r",
-      "Epoch 0:   6%| | 612/10070 [17:37<4:32:22,  1.73s/it, v_num=tif6, train/loss=3.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 613/10070 [17:38<4:32:04,  1.73s/it, v_num=tif6, train/loss=3.8\r",
-      "Epoch 0:   6%| | 613/10070 [17:38<4:32:04,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 614/10070 [17:38<4:31:47,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 614/10070 [17:38<4:31:47,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 615/10070 [17:40<4:31:45,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 615/10070 [17:40<4:31:45,  1.72s/it, v_num=tif6, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 616/10070 [17:42<4:31:44,  1.72s/it, v_num=tif6, train/loss=1.8\r",
-      "Epoch 0:   6%| | 616/10070 [17:42<4:31:44,  1.72s/it, v_num=tif6, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 617/10070 [17:43<4:31:26,  1.72s/it, v_num=tif6, train/loss=1.4\r",
-      "Epoch 0:   6%| | 617/10070 [17:43<4:31:26,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 618/10070 [17:45<4:31:32,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 618/10070 [17:45<4:31:32,  1.72s/it, v_num=tif6, train/loss=4.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 619/10070 [17:47<4:31:39,  1.72s/it, v_num=tif6, train/loss=4.1\r",
-      "Epoch 0:   6%| | 619/10070 [17:47<4:31:39,  1.72s/it, v_num=tif6, train/loss=2.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 620/10070 [17:48<4:31:29,  1.72s/it, v_num=tif6, train/loss=2.9\r",
-      "Epoch 0:   6%| | 620/10070 [17:48<4:31:29,  1.72s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 621/10070 [17:49<4:31:11,  1.72s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   6%| | 621/10070 [17:49<4:31:11,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 622/10070 [17:50<4:30:53,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 622/10070 [17:50<4:30:53,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 623/10070 [17:50<4:30:36,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 623/10070 [17:50<4:30:36,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 624/10070 [17:51<4:30:26,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 624/10070 [17:51<4:30:26,  1.72s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 625/10070 [17:53<4:30:16,  1.72s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:   6%| | 625/10070 [17:53<4:30:16,  1.72s/it, v_num=tif6, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 626/10070 [17:54<4:30:06,  1.72s/it, v_num=tif6, train/loss=0.7\r",
-      "Epoch 0:   6%| | 626/10070 [17:54<4:30:06,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 627/10070 [17:55<4:30:04,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   6%| | 627/10070 [17:55<4:30:04,  1.72s/it, v_num=tif6, train/loss=2.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 628/10070 [17:57<4:30:02,  1.72s/it, v_num=tif6, train/loss=2.3\r",
-      "Epoch 0:   6%| | 628/10070 [17:57<4:30:02,  1.72s/it, v_num=tif6, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 629/10070 [17:58<4:29:44,  1.71s/it, v_num=tif6, train/loss=1.4\r",
-      "Epoch 0:   6%| | 629/10070 [17:58<4:29:44,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 630/10070 [17:59<4:29:35,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 630/10070 [17:59<4:29:35,  1.71s/it, v_num=tif6, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 631/10070 [18:01<4:29:41,  1.71s/it, v_num=tif6, train/loss=1.1\r",
-      "Epoch 0:   6%| | 631/10070 [18:01<4:29:41,  1.71s/it, v_num=tif6, train/loss=3.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 632/10070 [18:02<4:29:31,  1.71s/it, v_num=tif6, train/loss=3.9\r",
-      "Epoch 0:   6%| | 632/10070 [18:02<4:29:31,  1.71s/it, v_num=tif6, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 633/10070 [18:05<4:29:38,  1.71s/it, v_num=tif6, train/loss=0.4\r",
-      "Epoch 0:   6%| | 633/10070 [18:05<4:29:38,  1.71s/it, v_num=tif6, train/loss=3.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 634/10070 [18:07<4:29:45,  1.72s/it, v_num=tif6, train/loss=3.4\r",
-      "Epoch 0:   6%| | 634/10070 [18:07<4:29:45,  1.72s/it, v_num=tif6, train/loss=3.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 635/10070 [18:09<4:29:44,  1.72s/it, v_num=tif6, train/loss=3.4\r",
-      "Epoch 0:   6%| | 635/10070 [18:09<4:29:44,  1.72s/it, v_num=tif6, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 636/10070 [18:09<4:29:27,  1.71s/it, v_num=tif6, train/loss=2.1\r",
-      "Epoch 0:   6%| | 636/10070 [18:09<4:29:27,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 637/10070 [18:11<4:29:18,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 637/10070 [18:11<4:29:18,  1.71s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 638/10070 [18:13<4:29:25,  1.71s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   6%| | 638/10070 [18:13<4:29:25,  1.71s/it, v_num=tif6, train/loss=2.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 639/10070 [18:15<4:29:24,  1.71s/it, v_num=tif6, train/loss=2.8\r",
-      "Epoch 0:   6%| | 639/10070 [18:15<4:29:24,  1.71s/it, v_num=tif6, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 640/10070 [18:23<4:30:56,  1.72s/it, v_num=tif6, train/loss=1.6\r",
-      "Epoch 0:   6%| | 640/10070 [18:23<4:30:56,  1.72s/it, v_num=tif6, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 641/10070 [18:24<4:30:47,  1.72s/it, v_num=tif6, train/loss=3.2\r",
-      "Epoch 0:   6%| | 641/10070 [18:24<4:30:47,  1.72s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 642/10070 [18:25<4:30:30,  1.72s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   6%| | 642/10070 [18:25<4:30:30,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 643/10070 [18:26<4:30:28,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   6%| | 643/10070 [18:26<4:30:28,  1.72s/it, v_num=tif6, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 644/10070 [18:27<4:30:12,  1.72s/it, v_num=tif6, train/loss=1.4\r",
-      "Epoch 0:   6%| | 644/10070 [18:27<4:30:12,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 645/10070 [18:28<4:29:55,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 645/10070 [18:28<4:29:55,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 646/10070 [18:28<4:29:38,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 646/10070 [18:28<4:29:38,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 647/10070 [18:30<4:29:28,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 647/10070 [18:30<4:29:28,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 648/10070 [18:31<4:29:18,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   6%| | 648/10070 [18:31<4:29:18,  1.72s/it, v_num=tif6, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 649/10070 [18:33<4:29:24,  1.72s/it, v_num=tif6, train/loss=0.4\r",
-      "Epoch 0:   6%| | 649/10070 [18:33<4:29:24,  1.72s/it, v_num=tif6, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 650/10070 [18:35<4:29:22,  1.72s/it, v_num=tif6, train/loss=3.3\r",
-      "Epoch 0:   6%| | 650/10070 [18:35<4:29:22,  1.72s/it, v_num=tif6, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 651/10070 [18:36<4:29:12,  1.71s/it, v_num=tif6, train/loss=1.1\r",
-      "Epoch 0:   6%| | 651/10070 [18:36<4:29:12,  1.71s/it, v_num=tif6, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 652/10070 [18:37<4:28:56,  1.71s/it, v_num=tif6, train/loss=0.9\r",
-      "Epoch 0:   6%| | 652/10070 [18:37<4:28:56,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 653/10070 [18:37<4:28:39,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 653/10070 [18:37<4:28:39,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   6%| | 654/10070 [18:39<4:28:44,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   6%| | 654/10070 [18:39<4:28:44,  1.71s/it, v_num=tif6, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 655/10070 [18:41<4:28:34,  1.71s/it, v_num=tif6, train/loss=3.1\r",
-      "Epoch 0:   7%| | 655/10070 [18:41<4:28:34,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 656/10070 [18:43<4:28:40,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 656/10070 [18:43<4:28:40,  1.71s/it, v_num=tif6, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 657/10070 [18:44<4:28:30,  1.71s/it, v_num=tif6, train/loss=3.3\r",
-      "Epoch 0:   7%| | 657/10070 [18:44<4:28:30,  1.71s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 658/10070 [18:45<4:28:14,  1.71s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   7%| | 658/10070 [18:45<4:28:14,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 659/10070 [18:46<4:28:05,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 659/10070 [18:46<4:28:05,  1.71s/it, v_num=tif6, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 660/10070 [18:48<4:28:11,  1.71s/it, v_num=tif6, train/loss=1.1\r",
-      "Epoch 0:   7%| | 660/10070 [18:48<4:28:11,  1.71s/it, v_num=tif6, train/loss=3.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 661/10070 [18:50<4:28:18,  1.71s/it, v_num=tif6, train/loss=3.4\r",
-      "Epoch 0:   7%| | 661/10070 [18:50<4:28:18,  1.71s/it, v_num=tif6, train/loss=2.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 662/10070 [18:52<4:28:17,  1.71s/it, v_num=tif6, train/loss=2.9\r",
-      "Epoch 0:   7%| | 662/10070 [18:52<4:28:17,  1.71s/it, v_num=tif6, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 663/10070 [18:54<4:28:16,  1.71s/it, v_num=tif6, train/loss=1.5\r",
-      "Epoch 0:   7%| | 663/10070 [18:54<4:28:16,  1.71s/it, v_num=tif6, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 664/10070 [18:56<4:28:15,  1.71s/it, v_num=tif6, train/loss=1.2\r",
-      "Epoch 0:   7%| | 664/10070 [18:56<4:28:15,  1.71s/it, v_num=tif6, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 665/10070 [18:57<4:28:06,  1.71s/it, v_num=tif6, train/loss=1.3\r",
-      "Epoch 0:   7%| | 665/10070 [18:57<4:28:06,  1.71s/it, v_num=tif6, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 666/10070 [18:58<4:27:50,  1.71s/it, v_num=tif6, train/loss=0.7\r",
-      "Epoch 0:   7%| | 666/10070 [18:58<4:27:50,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 667/10070 [18:59<4:27:41,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 667/10070 [18:59<4:27:41,  1.71s/it, v_num=tif6, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 668/10070 [19:00<4:27:33,  1.71s/it, v_num=tif6, train/loss=0.4\r",
-      "Epoch 0:   7%| | 668/10070 [19:00<4:27:33,  1.71s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 669/10070 [19:02<4:27:31,  1.71s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   7%| | 669/10070 [19:02<4:27:32,  1.71s/it, v_num=tif6, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 670/10070 [19:03<4:27:23,  1.71s/it, v_num=tif6, train/loss=2.5\r",
-      "Epoch 0:   7%| | 670/10070 [19:03<4:27:23,  1.71s/it, v_num=tif6, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 671/10070 [19:05<4:27:30,  1.71s/it, v_num=tif6, train/loss=0.9\r",
-      "Epoch 0:   7%| | 671/10070 [19:05<4:27:30,  1.71s/it, v_num=tif6, train/loss=4.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 672/10070 [19:17<4:29:54,  1.72s/it, v_num=tif6, train/loss=4.0\r",
-      "Epoch 0:   7%| | 672/10070 [19:17<4:29:54,  1.72s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 673/10070 [19:18<4:29:38,  1.72s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   7%| | 673/10070 [19:18<4:29:38,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 674/10070 [19:20<4:29:36,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 674/10070 [19:20<4:29:36,  1.72s/it, v_num=tif6, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 675/10070 [19:22<4:29:42,  1.72s/it, v_num=tif6, train/loss=2.1\r",
-      "Epoch 0:   7%| | 675/10070 [19:22<4:29:42,  1.72s/it, v_num=tif6, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 676/10070 [19:23<4:29:33,  1.72s/it, v_num=tif6, train/loss=3.2\r",
-      "Epoch 0:   7%| | 676/10070 [19:23<4:29:33,  1.72s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 677/10070 [19:24<4:29:17,  1.72s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   7%| | 677/10070 [19:24<4:29:17,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 678/10070 [19:25<4:29:01,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 678/10070 [19:25<4:29:01,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 679/10070 [19:25<4:28:45,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 679/10070 [19:25<4:28:45,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 680/10070 [19:28<4:28:51,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 680/10070 [19:28<4:28:51,  1.72s/it, v_num=tif6, train/loss=2.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 681/10070 [19:29<4:28:42,  1.72s/it, v_num=tif6, train/loss=2.8\r",
-      "Epoch 0:   7%| | 681/10070 [19:29<4:28:42,  1.72s/it, v_num=tif6, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 682/10070 [19:30<4:28:26,  1.72s/it, v_num=tif6, train/loss=0.7\r",
-      "Epoch 0:   7%| | 682/10070 [19:30<4:28:26,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 683/10070 [19:31<4:28:18,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 683/10070 [19:31<4:28:18,  1.71s/it, v_num=tif6, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 684/10070 [19:33<4:28:23,  1.72s/it, v_num=tif6, train/loss=0.4\r",
-      "Epoch 0:   7%| | 684/10070 [19:33<4:28:23,  1.72s/it, v_num=tif6, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 685/10070 [19:35<4:28:21,  1.72s/it, v_num=tif6, train/loss=3.5\r",
-      "Epoch 0:   7%| | 685/10070 [19:35<4:28:21,  1.72s/it, v_num=tif6, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 686/10070 [19:37<4:28:28,  1.72s/it, v_num=tif6, train/loss=1.4\r",
-      "Epoch 0:   7%| | 686/10070 [19:37<4:28:28,  1.72s/it, v_num=tif6, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 687/10070 [19:39<4:28:34,  1.72s/it, v_num=tif6, train/loss=3.5\r",
-      "Epoch 0:   7%| | 687/10070 [19:39<4:28:34,  1.72s/it, v_num=tif6, train/loss=2.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 688/10070 [19:40<4:28:18,  1.72s/it, v_num=tif6, train/loss=2.8\r",
-      "Epoch 0:   7%| | 688/10070 [19:40<4:28:18,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 689/10070 [19:42<4:28:17,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 689/10070 [19:42<4:28:17,  1.72s/it, v_num=tif6, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 690/10070 [19:44<4:28:23,  1.72s/it, v_num=tif6, train/loss=1.4\r",
-      "Epoch 0:   7%| | 690/10070 [19:44<4:28:23,  1.72s/it, v_num=tif6, train/loss=3.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 691/10070 [19:45<4:28:08,  1.72s/it, v_num=tif6, train/loss=3.0\r",
-      "Epoch 0:   7%| | 691/10070 [19:45<4:28:08,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 692/10070 [19:46<4:27:59,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 692/10070 [19:46<4:27:59,  1.71s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 693/10070 [19:48<4:28:04,  1.72s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:   7%| | 693/10070 [19:48<4:28:04,  1.72s/it, v_num=tif6, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 694/10070 [19:49<4:27:56,  1.71s/it, v_num=tif6, train/loss=3.2\r",
-      "Epoch 0:   7%| | 694/10070 [19:49<4:27:56,  1.71s/it, v_num=tif6, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 695/10070 [19:50<4:27:40,  1.71s/it, v_num=tif6, train/loss=0.8\r",
-      "Epoch 0:   7%| | 695/10070 [19:50<4:27:40,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 696/10070 [19:51<4:27:24,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 696/10070 [19:51<4:27:24,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 697/10070 [19:53<4:27:23,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 697/10070 [19:53<4:27:23,  1.71s/it, v_num=tif6, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 698/10070 [19:54<4:27:15,  1.71s/it, v_num=tif6, train/loss=1.4\r",
-      "Epoch 0:   7%| | 698/10070 [19:54<4:27:15,  1.71s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 699/10070 [19:56<4:27:20,  1.71s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   7%| | 699/10070 [19:56<4:27:20,  1.71s/it, v_num=tif6, train/loss=3.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 700/10070 [19:57<4:27:12,  1.71s/it, v_num=tif6, train/loss=3.6\r",
-      "Epoch 0:   7%| | 700/10070 [19:57<4:27:12,  1.71s/it, v_num=tif6, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 701/10070 [20:00<4:27:18,  1.71s/it, v_num=tif6, train/loss=0.7\r",
-      "Epoch 0:   7%| | 701/10070 [20:00<4:27:18,  1.71s/it, v_num=tif6, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 702/10070 [20:01<4:27:10,  1.71s/it, v_num=tif6, train/loss=3.2\r",
-      "Epoch 0:   7%| | 702/10070 [20:01<4:27:10,  1.71s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 703/10070 [20:01<4:26:54,  1.71s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   7%| | 703/10070 [20:01<4:26:54,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 704/10070 [20:11<4:28:35,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 704/10070 [20:11<4:28:35,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 705/10070 [20:13<4:28:34,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 705/10070 [20:13<4:28:34,  1.72s/it, v_num=tif6, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 706/10070 [20:15<4:28:40,  1.72s/it, v_num=tif6, train/loss=2.2\r",
-      "Epoch 0:   7%| | 706/10070 [20:15<4:28:40,  1.72s/it, v_num=tif6, train/loss=3.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 707/10070 [20:16<4:28:32,  1.72s/it, v_num=tif6, train/loss=3.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 707/10070 [20:16<4:28:32,  1.72s/it, v_num=tif6, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 708/10070 [20:18<4:28:30,  1.72s/it, v_num=tif6, train/loss=0.8\r",
-      "Epoch 0:   7%| | 708/10070 [20:18<4:28:30,  1.72s/it, v_num=tif6, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 709/10070 [20:19<4:28:22,  1.72s/it, v_num=tif6, train/loss=1.1\r",
-      "Epoch 0:   7%| | 709/10070 [20:19<4:28:22,  1.72s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 710/10070 [20:20<4:28:13,  1.72s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   7%| | 710/10070 [20:20<4:28:13,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 711/10070 [20:22<4:28:05,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   7%| | 711/10070 [20:22<4:28:05,  1.72s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 712/10070 [20:23<4:28:04,  1.72s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:   7%| | 712/10070 [20:23<4:28:04,  1.72s/it, v_num=tif6, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 713/10070 [20:25<4:28:03,  1.72s/it, v_num=tif6, train/loss=1.2\r",
-      "Epoch 0:   7%| | 713/10070 [20:25<4:28:03,  1.72s/it, v_num=tif6, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 714/10070 [20:27<4:28:08,  1.72s/it, v_num=tif6, train/loss=1.5\r",
-      "Epoch 0:   7%| | 714/10070 [20:27<4:28:08,  1.72s/it, v_num=tif6, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 715/10070 [20:29<4:28:00,  1.72s/it, v_num=tif6, train/loss=3.2\r",
-      "Epoch 0:   7%| | 715/10070 [20:29<4:28:00,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 716/10070 [20:31<4:28:05,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   7%| | 716/10070 [20:31<4:28:05,  1.72s/it, v_num=tif6, train/loss=2.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 717/10070 [20:32<4:27:57,  1.72s/it, v_num=tif6, train/loss=2.4\r",
-      "Epoch 0:   7%| | 717/10070 [20:32<4:27:57,  1.72s/it, v_num=tif6, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 718/10070 [20:34<4:28:02,  1.72s/it, v_num=tif6, train/loss=0.7\r",
-      "Epoch 0:   7%| | 718/10070 [20:34<4:28:02,  1.72s/it, v_num=tif6, train/loss=3.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 719/10070 [20:36<4:28:00,  1.72s/it, v_num=tif6, train/loss=3.4\r",
-      "Epoch 0:   7%| | 719/10070 [20:36<4:28:00,  1.72s/it, v_num=tif6, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 720/10070 [20:37<4:27:52,  1.72s/it, v_num=tif6, train/loss=1.6\r",
-      "Epoch 0:   7%| | 720/10070 [20:37<4:27:52,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 721/10070 [20:39<4:27:57,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 721/10070 [20:39<4:27:57,  1.72s/it, v_num=tif6, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 722/10070 [20:40<4:27:41,  1.72s/it, v_num=tif6, train/loss=3.2\r",
-      "Epoch 0:   7%| | 722/10070 [20:40<4:27:41,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 723/10070 [20:42<4:27:39,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 723/10070 [20:42<4:27:39,  1.72s/it, v_num=tif6, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 724/10070 [20:44<4:27:44,  1.72s/it, v_num=tif6, train/loss=1.6\r",
-      "Epoch 0:   7%| | 724/10070 [20:44<4:27:44,  1.72s/it, v_num=tif6, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 725/10070 [20:45<4:27:29,  1.72s/it, v_num=tif6, train/loss=3.2\r",
-      "Epoch 0:   7%| | 725/10070 [20:45<4:27:29,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 726/10070 [20:46<4:27:21,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 726/10070 [20:46<4:27:21,  1.72s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 727/10070 [20:47<4:27:06,  1.72s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   7%| | 727/10070 [20:47<4:27:06,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 728/10070 [20:48<4:27:04,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 728/10070 [20:48<4:27:04,  1.72s/it, v_num=tif6, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 729/10070 [20:49<4:26:49,  1.71s/it, v_num=tif6, train/loss=1.6\r",
-      "Epoch 0:   7%| | 729/10070 [20:49<4:26:49,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 730/10070 [20:50<4:26:34,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 730/10070 [20:50<4:26:34,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 731/10070 [20:50<4:26:19,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 731/10070 [20:50<4:26:19,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 732/10070 [20:52<4:26:17,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 732/10070 [20:52<4:26:17,  1.71s/it, v_num=tif6, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 733/10070 [20:53<4:26:09,  1.71s/it, v_num=tif6, train/loss=1.5\r",
-      "Epoch 0:   7%| | 733/10070 [20:53<4:26:09,  1.71s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 734/10070 [20:54<4:26:00,  1.71s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   7%| | 734/10070 [20:54<4:26:00,  1.71s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 735/10070 [20:56<4:25:59,  1.71s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:   7%| | 735/10070 [20:56<4:25:59,  1.71s/it, v_num=tif6, train/loss=2.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 736/10070 [21:04<4:27:12,  1.72s/it, v_num=tif6, train/loss=2.3\r",
-      "Epoch 0:   7%| | 736/10070 [21:04<4:27:12,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 737/10070 [21:06<4:27:17,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 737/10070 [21:06<4:27:17,  1.72s/it, v_num=tif6, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 738/10070 [21:07<4:27:03,  1.72s/it, v_num=tif6, train/loss=3.1\r",
-      "Epoch 0:   7%| | 738/10070 [21:07<4:27:03,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 739/10070 [21:08<4:26:55,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 739/10070 [21:08<4:26:55,  1.72s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 740/10070 [21:09<4:26:40,  1.72s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   7%| | 740/10070 [21:09<4:26:41,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 741/10070 [21:10<4:26:33,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 741/10070 [21:10<4:26:33,  1.71s/it, v_num=tif6, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 742/10070 [21:11<4:26:25,  1.71s/it, v_num=tif6, train/loss=0.9\r",
-      "Epoch 0:   7%| | 742/10070 [21:11<4:26:25,  1.71s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 743/10070 [21:12<4:26:11,  1.71s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   7%| | 743/10070 [21:12<4:26:11,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 744/10070 [21:14<4:26:09,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 744/10070 [21:14<4:26:09,  1.71s/it, v_num=tif6, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 745/10070 [21:15<4:26:02,  1.71s/it, v_num=tif6, train/loss=1.3\r",
-      "Epoch 0:   7%| | 745/10070 [21:15<4:26:02,  1.71s/it, v_num=tif6, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 746/10070 [21:15<4:25:48,  1.71s/it, v_num=tif6, train/loss=0.4\r",
-      "Epoch 0:   7%| | 746/10070 [21:15<4:25:48,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 747/10070 [21:18<4:25:53,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 747/10070 [21:18<4:25:53,  1.71s/it, v_num=tif6, train/loss=3.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 748/10070 [21:18<4:25:39,  1.71s/it, v_num=tif6, train/loss=3.0\r",
-      "Epoch 0:   7%| | 748/10070 [21:18<4:25:39,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 749/10070 [21:21<4:25:44,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 749/10070 [21:21<4:25:44,  1.71s/it, v_num=tif6, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 750/10070 [21:21<4:25:29,  1.71s/it, v_num=tif6, train/loss=3.1\r",
-      "Epoch 0:   7%| | 750/10070 [21:21<4:25:29,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 751/10070 [21:24<4:25:34,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   7%| | 751/10070 [21:24<4:25:35,  1.71s/it, v_num=tif6, train/loss=2.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 752/10070 [21:26<4:25:40,  1.71s/it, v_num=tif6, train/loss=2.4\r",
-      "Epoch 0:   7%| | 752/10070 [21:26<4:25:40,  1.71s/it, v_num=tif6, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 753/10070 [21:28<4:25:38,  1.71s/it, v_num=tif6, train/loss=3.1\r",
-      "Epoch 0:   7%| | 753/10070 [21:28<4:25:38,  1.71s/it, v_num=tif6, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 754/10070 [21:30<4:25:43,  1.71s/it, v_num=tif6, train/loss=1.7\r",
-      "Epoch 0:   7%| | 754/10070 [21:30<4:25:43,  1.71s/it, v_num=tif6, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   7%| | 755/10070 [21:32<4:25:42,  1.71s/it, v_num=tif6, train/loss=2.1\r",
-      "Epoch 0:   7%| | 755/10070 [21:32<4:25:42,  1.71s/it, v_num=tif6, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 756/10070 [21:33<4:25:41,  1.71s/it, v_num=tif6, train/loss=1.5\r",
-      "Epoch 0:   8%| | 756/10070 [21:33<4:25:41,  1.71s/it, v_num=tif6, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 757/10070 [21:34<4:25:26,  1.71s/it, v_num=tif6, train/loss=1.0\r",
-      "Epoch 0:   8%| | 757/10070 [21:34<4:25:26,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 758/10070 [21:35<4:25:18,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 758/10070 [21:35<4:25:18,  1.71s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 759/10070 [21:37<4:25:17,  1.71s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   8%| | 759/10070 [21:37<4:25:17,  1.71s/it, v_num=tif6, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 760/10070 [21:38<4:25:02,  1.71s/it, v_num=tif6, train/loss=1.4\r",
-      "Epoch 0:   8%| | 760/10070 [21:38<4:25:02,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 761/10070 [21:39<4:24:55,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 761/10070 [21:39<4:24:55,  1.71s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 762/10070 [21:40<4:24:40,  1.71s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   8%| | 762/10070 [21:40<4:24:40,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 763/10070 [21:41<4:24:38,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 763/10070 [21:41<4:24:38,  1.71s/it, v_num=tif6, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 764/10070 [21:43<4:24:37,  1.71s/it, v_num=tif6, train/loss=1.1\r",
-      "Epoch 0:   8%| | 764/10070 [21:43<4:24:37,  1.71s/it, v_num=tif6, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 765/10070 [21:45<4:24:42,  1.71s/it, v_num=tif6, train/loss=1.7\r",
-      "Epoch 0:   8%| | 765/10070 [21:45<4:24:42,  1.71s/it, v_num=tif6, train/loss=2.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 766/10070 [21:46<4:24:34,  1.71s/it, v_num=tif6, train/loss=2.6\r",
-      "Epoch 0:   8%| | 766/10070 [21:46<4:24:34,  1.71s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 767/10070 [21:48<4:24:32,  1.71s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   8%| | 767/10070 [21:48<4:24:32,  1.71s/it, v_num=tif6, train/loss=2.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 768/10070 [21:57<4:25:51,  1.71s/it, v_num=tif6, train/loss=2.3\r",
-      "Epoch 0:   8%| | 768/10070 [21:57<4:25:51,  1.71s/it, v_num=tif6, train/loss=2.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 769/10070 [21:57<4:25:37,  1.71s/it, v_num=tif6, train/loss=2.6\r",
-      "Epoch 0:   8%| | 769/10070 [21:57<4:25:37,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 770/10070 [21:58<4:25:23,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 770/10070 [21:58<4:25:23,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 771/10070 [22:00<4:25:28,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 771/10070 [22:00<4:25:28,  1.71s/it, v_num=tif6, train/loss=2.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 772/10070 [22:02<4:25:34,  1.71s/it, v_num=tif6, train/loss=2.4\r",
-      "Epoch 0:   8%| | 772/10070 [22:02<4:25:34,  1.71s/it, v_num=tif6, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 773/10070 [22:03<4:25:20,  1.71s/it, v_num=tif6, train/loss=3.5\r",
-      "Epoch 0:   8%| | 773/10070 [22:03<4:25:20,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 774/10070 [22:04<4:25:12,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 774/10070 [22:04<4:25:12,  1.71s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 775/10070 [22:05<4:24:58,  1.71s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   8%| | 775/10070 [22:05<4:24:58,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 776/10070 [22:07<4:25:03,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 776/10070 [22:07<4:25:03,  1.71s/it, v_num=tif6, train/loss=3.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 777/10070 [22:08<4:24:49,  1.71s/it, v_num=tif6, train/loss=3.4\r",
-      "Epoch 0:   8%| | 777/10070 [22:08<4:24:49,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 778/10070 [22:10<4:24:53,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 778/10070 [22:10<4:24:53,  1.71s/it, v_num=tif6, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 779/10070 [22:11<4:24:39,  1.71s/it, v_num=tif6, train/loss=3.1\r",
-      "Epoch 0:   8%| | 779/10070 [22:11<4:24:39,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 780/10070 [22:13<4:24:44,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 780/10070 [22:13<4:24:44,  1.71s/it, v_num=tif6, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 781/10070 [22:14<4:24:36,  1.71s/it, v_num=tif6, train/loss=3.1\r",
-      "Epoch 0:   8%| | 781/10070 [22:14<4:24:36,  1.71s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 782/10070 [22:16<4:24:29,  1.71s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   8%| | 782/10070 [22:16<4:24:29,  1.71s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 783/10070 [22:18<4:24:34,  1.71s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   8%| | 783/10070 [22:18<4:24:34,  1.71s/it, v_num=tif6, train/loss=3.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 784/10070 [22:19<4:24:20,  1.71s/it, v_num=tif6, train/loss=3.6\r",
-      "Epoch 0:   8%| | 784/10070 [22:19<4:24:20,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 785/10070 [22:20<4:24:19,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 785/10070 [22:20<4:24:19,  1.71s/it, v_num=tif6, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 786/10070 [22:22<4:24:18,  1.71s/it, v_num=tif6, train/loss=1.9\r",
-      "Epoch 0:   8%| | 786/10070 [22:22<4:24:18,  1.71s/it, v_num=tif6, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 787/10070 [22:23<4:24:10,  1.71s/it, v_num=tif6, train/loss=1.6\r",
-      "Epoch 0:   8%| | 787/10070 [22:23<4:24:10,  1.71s/it, v_num=tif6, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 788/10070 [22:26<4:24:15,  1.71s/it, v_num=tif6, train/loss=0.4\r",
-      "Epoch 0:   8%| | 788/10070 [22:26<4:24:15,  1.71s/it, v_num=tif6, train/loss=2.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 789/10070 [22:27<4:24:14,  1.71s/it, v_num=tif6, train/loss=2.6\r",
-      "Epoch 0:   8%| | 789/10070 [22:27<4:24:14,  1.71s/it, v_num=tif6, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 790/10070 [22:28<4:24:00,  1.71s/it, v_num=tif6, train/loss=1.0\r",
-      "Epoch 0:   8%| | 790/10070 [22:28<4:24:00,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 791/10070 [22:30<4:23:59,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 791/10070 [22:30<4:23:59,  1.71s/it, v_num=tif6, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 792/10070 [22:31<4:23:51,  1.71s/it, v_num=tif6, train/loss=1.8\r",
-      "Epoch 0:   8%| | 792/10070 [22:31<4:23:51,  1.71s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 793/10070 [22:33<4:23:56,  1.71s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   8%| | 793/10070 [22:33<4:23:56,  1.71s/it, v_num=tif6, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 794/10070 [22:34<4:23:48,  1.71s/it, v_num=tif6, train/loss=3.2\r",
-      "Epoch 0:   8%| | 794/10070 [22:34<4:23:48,  1.71s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 795/10070 [22:37<4:23:53,  1.71s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   8%| | 795/10070 [22:37<4:23:53,  1.71s/it, v_num=tif6, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 796/10070 [22:38<4:23:45,  1.71s/it, v_num=tif6, train/loss=2.1\r",
-      "Epoch 0:   8%| | 796/10070 [22:38<4:23:45,  1.71s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 797/10070 [22:38<4:23:31,  1.71s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   8%| | 797/10070 [22:38<4:23:31,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 798/10070 [22:40<4:23:29,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 798/10070 [22:40<4:23:29,  1.71s/it, v_num=tif6, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 799/10070 [22:41<4:23:15,  1.70s/it, v_num=tif6, train/loss=0.9\r",
-      "Epoch 0:   8%| | 799/10070 [22:41<4:23:15,  1.70s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 800/10070 [22:49<4:24:30,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 800/10070 [22:49<4:24:30,  1.71s/it, v_num=tif6, train/loss=0.0/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py:1802: UserWarning: Positional args are being deprecated, use kwargs instead. Refer to https://pytorch.org/docs/master/generated/torch.nn.Module.html#torch.nn.Module.state_dict for details.\r\n",
-      "  warnings.warn(\r\n",
-      "/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py:1802: UserWarning: Positional args are being deprecated, use kwargs instead. Refer to https://pytorch.org/docs/master/generated/torch.nn.Module.html#torch.nn.Module.state_dict for details.\r\n",
-      "  warnings.warn(\r\n",
-      "/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py:1802: UserWarning: Positional args are being deprecated, use kwargs instead. Refer to https://pytorch.org/docs/master/generated/torch.nn.Module.html#torch.nn.Module.state_dict for details.\r\n",
-      "  warnings.warn(\r\n",
-      "/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py:1802: UserWarning: Positional args are being deprecated, use kwargs instead. Refer to https://pytorch.org/docs/master/generated/torch.nn.Module.html#torch.nn.Module.state_dict for details.\r\n",
-      "  warnings.warn(\r\n",
-      "/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py:1802: UserWarning: Positional args are being deprecated, use kwargs instead. Refer to https://pytorch.org/docs/master/generated/torch.nn.Module.html#torch.nn.Module.state_dict for details.\r\n",
-      "  warnings.warn(\r\n",
-      "/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py:1802: UserWarning: Positional args are being deprecated, use kwargs instead. Refer to https://pytorch.org/docs/master/generated/torch.nn.Module.html#torch.nn.Module.state_dict for details.\r\n",
-      "  warnings.warn(\r\n",
-      "/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py:1802: UserWarning: Positional args are being deprecated, use kwargs instead. Refer to https://pytorch.org/docs/master/generated/torch.nn.Module.html#torch.nn.Module.state_dict for details.\r\n",
-      "  warnings.warn(\r\n",
-      "/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py:1802: UserWarning: Positional args are being deprecated, use kwargs instead. Refer to https://pytorch.org/docs/master/generated/torch.nn.Module.html#torch.nn.Module.state_dict for details.\r\n",
-      "  warnings.warn(\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 801/10070 [23:05<4:27:07,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 801/10070 [23:05<4:27:07,  1.73s/it, v_num=tif6, train/loss=3.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 802/10070 [23:07<4:27:11,  1.73s/it, v_num=tif6, train/loss=3.5\r",
-      "Epoch 0:   8%| | 802/10070 [23:07<4:27:11,  1.73s/it, v_num=tif6, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 803/10070 [23:09<4:27:16,  1.73s/it, v_num=tif6, train/loss=2.5\r",
-      "Epoch 0:   8%| | 803/10070 [23:09<4:27:16,  1.73s/it, v_num=tif6, train/loss=2.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 804/10070 [23:11<4:27:20,  1.73s/it, v_num=tif6, train/loss=2.4\r",
-      "Epoch 0:   8%| | 804/10070 [23:11<4:27:20,  1.73s/it, v_num=tif6, train/loss=2.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 805/10070 [23:12<4:27:06,  1.73s/it, v_num=tif6, train/loss=2.4\r",
-      "Epoch 0:   8%| | 805/10070 [23:12<4:27:06,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 806/10070 [23:13<4:26:53,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 806/10070 [23:13<4:26:53,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 807/10070 [23:15<4:26:57,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 807/10070 [23:15<4:26:57,  1.73s/it, v_num=tif6, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 808/10070 [23:16<4:26:43,  1.73s/it, v_num=tif6, train/loss=2.5\r",
-      "Epoch 0:   8%| | 808/10070 [23:16<4:26:43,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 809/10070 [23:16<4:26:30,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 809/10070 [23:16<4:26:30,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 810/10070 [23:18<4:26:22,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 810/10070 [23:18<4:26:22,  1.73s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 811/10070 [23:18<4:26:09,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 811/10070 [23:18<4:26:09,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 812/10070 [23:20<4:26:08,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 812/10070 [23:20<4:26:08,  1.72s/it, v_num=tif6, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 813/10070 [23:21<4:26:00,  1.72s/it, v_num=tif6, train/loss=1.2\r",
-      "Epoch 0:   8%| | 813/10070 [23:21<4:26:00,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 814/10070 [23:22<4:25:52,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   8%| | 814/10070 [23:22<4:25:52,  1.72s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 815/10070 [23:24<4:25:45,  1.72s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:   8%| | 815/10070 [23:24<4:25:45,  1.72s/it, v_num=tif6, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 816/10070 [23:24<4:25:31,  1.72s/it, v_num=tif6, train/loss=0.9\r",
-      "Epoch 0:   8%| | 816/10070 [23:24<4:25:31,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 817/10070 [23:25<4:25:18,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 817/10070 [23:25<4:25:18,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 818/10070 [23:27<4:25:23,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 818/10070 [23:27<4:25:23,  1.72s/it, v_num=tif6, train/loss=2.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 819/10070 [23:29<4:25:15,  1.72s/it, v_num=tif6, train/loss=2.9\r",
-      "Epoch 0:   8%| | 819/10070 [23:29<4:25:15,  1.72s/it, v_num=tif6, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 820/10070 [23:30<4:25:08,  1.72s/it, v_num=tif6, train/loss=0.7\r",
-      "Epoch 0:   8%| | 820/10070 [23:30<4:25:08,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 821/10070 [23:32<4:25:07,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   8%| | 821/10070 [23:32<4:25:07,  1.72s/it, v_num=tif6, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 822/10070 [23:32<4:24:54,  1.72s/it, v_num=tif6, train/loss=1.7\r",
-      "Epoch 0:   8%| | 822/10070 [23:32<4:24:54,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 823/10070 [23:33<4:24:41,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 823/10070 [23:33<4:24:41,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 824/10070 [23:34<4:24:33,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 824/10070 [23:34<4:24:33,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 825/10070 [23:35<4:24:26,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 825/10070 [23:35<4:24:26,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 826/10070 [23:36<4:24:13,  1.71s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   8%| | 826/10070 [23:36<4:24:13,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 827/10070 [23:38<4:24:18,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 827/10070 [23:38<4:24:18,  1.72s/it, v_num=tif6, train/loss=2.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 828/10070 [23:40<4:24:10,  1.72s/it, v_num=tif6, train/loss=2.8\r",
-      "Epoch 0:   8%| | 828/10070 [23:40<4:24:10,  1.72s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 829/10070 [23:42<4:24:14,  1.72s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   8%| | 829/10070 [23:42<4:24:14,  1.72s/it, v_num=tif6, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 830/10070 [23:44<4:24:19,  1.72s/it, v_num=tif6, train/loss=3.1\r",
-      "Epoch 0:   8%| | 830/10070 [23:44<4:24:19,  1.72s/it, v_num=tif6, train/loss=3.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 831/10070 [23:45<4:24:05,  1.72s/it, v_num=tif6, train/loss=3.0\r",
-      "Epoch 0:   8%| | 831/10070 [23:45<4:24:05,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 832/10070 [23:58<4:26:07,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 832/10070 [23:58<4:26:07,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 833/10070 [23:58<4:25:53,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 833/10070 [23:58<4:25:53,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 834/10070 [23:59<4:25:40,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 834/10070 [23:59<4:25:40,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 835/10070 [24:01<4:25:44,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 835/10070 [24:01<4:25:44,  1.73s/it, v_num=tif6, train/loss=2.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 836/10070 [24:03<4:25:48,  1.73s/it, v_num=tif6, train/loss=2.8\r",
-      "Epoch 0:   8%| | 836/10070 [24:03<4:25:48,  1.73s/it, v_num=tif6, train/loss=2.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 837/10070 [24:06<4:25:51,  1.73s/it, v_num=tif6, train/loss=2.7\r",
-      "Epoch 0:   8%| | 837/10070 [24:06<4:25:51,  1.73s/it, v_num=tif6, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 838/10070 [24:07<4:25:49,  1.73s/it, v_num=tif6, train/loss=2.5\r",
-      "Epoch 0:   8%| | 838/10070 [24:07<4:25:49,  1.73s/it, v_num=tif6, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 839/10070 [24:08<4:25:41,  1.73s/it, v_num=tif6, train/loss=1.5\r",
-      "Epoch 0:   8%| | 839/10070 [24:08<4:25:41,  1.73s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 840/10070 [24:10<4:25:34,  1.73s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   8%| | 840/10070 [24:10<4:25:34,  1.73s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 841/10070 [24:12<4:25:38,  1.73s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   8%| | 841/10070 [24:12<4:25:38,  1.73s/it, v_num=tif6, train/loss=3.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 842/10070 [24:14<4:25:36,  1.73s/it, v_num=tif6, train/loss=3.0\r",
-      "Epoch 0:   8%| | 842/10070 [24:14<4:25:36,  1.73s/it, v_num=tif6, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 843/10070 [24:14<4:25:22,  1.73s/it, v_num=tif6, train/loss=1.4\r",
-      "Epoch 0:   8%| | 843/10070 [24:14<4:25:22,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 844/10070 [24:16<4:25:26,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 844/10070 [24:16<4:25:26,  1.73s/it, v_num=tif6, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 845/10070 [24:18<4:25:24,  1.73s/it, v_num=tif6, train/loss=3.3\r",
-      "Epoch 0:   8%| | 845/10070 [24:18<4:25:24,  1.73s/it, v_num=tif6, train/loss=1.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 846/10070 [24:19<4:25:11,  1.73s/it, v_num=tif6, train/loss=1.8\r",
-      "Epoch 0:   8%| | 846/10070 [24:19<4:25:11,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 847/10070 [24:21<4:25:15,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 847/10070 [24:21<4:25:15,  1.73s/it, v_num=tif6, train/loss=2.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 848/10070 [24:22<4:25:01,  1.72s/it, v_num=tif6, train/loss=2.8\r",
-      "Epoch 0:   8%| | 848/10070 [24:22<4:25:01,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 849/10070 [24:22<4:24:48,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 849/10070 [24:22<4:24:48,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 850/10070 [24:23<4:24:35,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 850/10070 [24:23<4:24:35,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 851/10070 [24:24<4:24:22,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 851/10070 [24:24<4:24:22,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 852/10070 [24:25<4:24:14,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 852/10070 [24:25<4:24:14,  1.72s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 853/10070 [24:26<4:24:07,  1.72s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   8%| | 853/10070 [24:26<4:24:07,  1.72s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 854/10070 [24:27<4:23:54,  1.72s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   8%| | 854/10070 [24:27<4:23:54,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   8%| | 855/10070 [24:29<4:23:58,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   8%| | 855/10070 [24:29<4:23:58,  1.72s/it, v_num=tif6, train/loss=2.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 856/10070 [24:31<4:24:01,  1.72s/it, v_num=tif6, train/loss=2.9\r",
-      "Epoch 0:   9%| | 856/10070 [24:31<4:24:01,  1.72s/it, v_num=tif6, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 857/10070 [24:32<4:23:54,  1.72s/it, v_num=tif6, train/loss=2.5\r",
-      "Epoch 0:   9%| | 857/10070 [24:32<4:23:54,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 858/10070 [24:33<4:23:41,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   9%| | 858/10070 [24:33<4:23:41,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 859/10070 [24:35<4:23:39,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 859/10070 [24:35<4:23:39,  1.72s/it, v_num=tif6, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 860/10070 [24:35<4:23:26,  1.72s/it, v_num=tif6, train/loss=1.7\r",
-      "Epoch 0:   9%| | 860/10070 [24:35<4:23:26,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 861/10070 [24:38<4:23:30,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 861/10070 [24:38<4:23:30,  1.72s/it, v_num=tif6, train/loss=2.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 862/10070 [24:39<4:23:28,  1.72s/it, v_num=tif6, train/loss=2.9\r",
-      "Epoch 0:   9%| | 862/10070 [24:39<4:23:28,  1.72s/it, v_num=tif6, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 863/10070 [24:41<4:23:26,  1.72s/it, v_num=tif6, train/loss=1.0\r",
-      "Epoch 0:   9%| | 863/10070 [24:41<4:23:26,  1.72s/it, v_num=tif6, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 864/10070 [24:50<4:24:37,  1.72s/it, v_num=tif6, train/loss=1.3\r",
-      "Epoch 0:   9%| | 864/10070 [24:50<4:24:37,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 865/10070 [24:51<4:24:35,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 865/10070 [24:51<4:24:35,  1.72s/it, v_num=tif6, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 866/10070 [24:52<4:24:22,  1.72s/it, v_num=tif6, train/loss=1.6\r",
-      "Epoch 0:   9%| | 866/10070 [24:52<4:24:22,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 867/10070 [24:53<4:24:09,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 867/10070 [24:53<4:24:09,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 868/10070 [24:55<4:24:12,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   9%| | 868/10070 [24:55<4:24:12,  1.72s/it, v_num=tif6, train/loss=2.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 869/10070 [24:56<4:24:05,  1.72s/it, v_num=tif6, train/loss=2.9\r",
-      "Epoch 0:   9%| | 869/10070 [24:56<4:24:05,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 870/10070 [24:58<4:24:09,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   9%| | 870/10070 [24:58<4:24:10,  1.72s/it, v_num=tif6, train/loss=3.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 871/10070 [24:59<4:23:57,  1.72s/it, v_num=tif6, train/loss=3.4\r",
-      "Epoch 0:   9%| | 871/10070 [24:59<4:23:57,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 872/10070 [25:00<4:23:44,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 872/10070 [25:00<4:23:44,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 873/10070 [25:00<4:23:31,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 873/10070 [25:00<4:23:31,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 874/10070 [25:03<4:23:35,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 874/10070 [25:03<4:23:35,  1.72s/it, v_num=tif6, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 875/10070 [25:05<4:23:40,  1.72s/it, v_num=tif6, train/loss=3.3\r",
-      "Epoch 0:   9%| | 875/10070 [25:05<4:23:40,  1.72s/it, v_num=tif6, train/loss=2.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 876/10070 [25:07<4:23:43,  1.72s/it, v_num=tif6, train/loss=2.7\r",
-      "Epoch 0:   9%| | 876/10070 [25:07<4:23:43,  1.72s/it, v_num=tif6, train/loss=2.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 877/10070 [25:08<4:23:31,  1.72s/it, v_num=tif6, train/loss=2.6\r",
-      "Epoch 0:   9%| | 877/10070 [25:08<4:23:31,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 878/10070 [25:09<4:23:18,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 878/10070 [25:09<4:23:18,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 879/10070 [25:10<4:23:11,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 879/10070 [25:10<4:23:11,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 880/10070 [25:10<4:22:59,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   9%| | 880/10070 [25:10<4:22:59,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 881/10070 [25:11<4:22:47,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 881/10070 [25:11<4:22:47,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 882/10070 [25:13<4:22:45,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 882/10070 [25:13<4:22:45,  1.72s/it, v_num=tif6, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 883/10070 [25:15<4:22:44,  1.72s/it, v_num=tif6, train/loss=1.1\r",
-      "Epoch 0:   9%| | 883/10070 [25:15<4:22:44,  1.72s/it, v_num=tif6, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 884/10070 [25:17<4:22:48,  1.72s/it, v_num=tif6, train/loss=2.0\r",
-      "Epoch 0:   9%| | 884/10070 [25:17<4:22:48,  1.72s/it, v_num=tif6, train/loss=2.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 885/10070 [25:18<4:22:41,  1.72s/it, v_num=tif6, train/loss=2.9\r",
-      "Epoch 0:   9%| | 885/10070 [25:18<4:22:41,  1.72s/it, v_num=tif6, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 886/10070 [25:20<4:22:45,  1.72s/it, v_num=tif6, train/loss=0.7\r",
-      "Epoch 0:   9%| | 886/10070 [25:20<4:22:45,  1.72s/it, v_num=tif6, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 887/10070 [25:23<4:22:49,  1.72s/it, v_num=tif6, train/loss=2.1\r",
-      "Epoch 0:   9%| | 887/10070 [25:23<4:22:49,  1.72s/it, v_num=tif6, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 888/10070 [25:23<4:22:36,  1.72s/it, v_num=tif6, train/loss=2.1\r",
-      "Epoch 0:   9%| | 888/10070 [25:23<4:22:36,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 889/10070 [25:25<4:22:35,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 889/10070 [25:25<4:22:35,  1.72s/it, v_num=tif6, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 890/10070 [25:27<4:22:39,  1.72s/it, v_num=tif6, train/loss=1.9\r",
-      "Epoch 0:   9%| | 890/10070 [25:27<4:22:39,  1.72s/it, v_num=tif6, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 891/10070 [25:28<4:22:27,  1.72s/it, v_num=tif6, train/loss=2.2\r",
-      "Epoch 0:   9%| | 891/10070 [25:28<4:22:27,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 892/10070 [25:30<4:22:25,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 892/10070 [25:30<4:22:25,  1.72s/it, v_num=tif6, train/loss=1.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 893/10070 [25:31<4:22:18,  1.72s/it, v_num=tif6, train/loss=1.9\r",
-      "Epoch 0:   9%| | 893/10070 [25:31<4:22:18,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 894/10070 [25:32<4:22:11,  1.71s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   9%| | 894/10070 [25:32<4:22:11,  1.71s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 895/10070 [25:33<4:22:05,  1.71s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   9%| | 895/10070 [25:33<4:22:05,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 896/10070 [25:48<4:24:14,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 896/10070 [25:48<4:24:14,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 897/10070 [25:50<4:24:17,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 897/10070 [25:50<4:24:17,  1.73s/it, v_num=tif6, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 898/10070 [25:52<4:24:16,  1.73s/it, v_num=tif6, train/loss=2.5\r",
-      "Epoch 0:   9%| | 898/10070 [25:52<4:24:16,  1.73s/it, v_num=tif6, train/loss=1.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 899/10070 [25:53<4:24:03,  1.73s/it, v_num=tif6, train/loss=1.6\r",
-      "Epoch 0:   9%| | 899/10070 [25:53<4:24:03,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 900/10070 [25:54<4:24:02,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 900/10070 [25:54<4:24:02,  1.73s/it, v_num=tif6, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 901/10070 [25:55<4:23:49,  1.73s/it, v_num=tif6, train/loss=1.3\r",
-      "Epoch 0:   9%| | 901/10070 [25:55<4:23:49,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 902/10070 [25:57<4:23:53,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 902/10070 [25:57<4:23:53,  1.73s/it, v_num=tif6, train/loss=2.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 903/10070 [26:00<4:23:57,  1.73s/it, v_num=tif6, train/loss=2.7\r",
-      "Epoch 0:   9%| | 903/10070 [26:00<4:23:57,  1.73s/it, v_num=tif6, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 904/10070 [26:01<4:23:50,  1.73s/it, v_num=tif6, train/loss=2.1\r",
-      "Epoch 0:   9%| | 904/10070 [26:01<4:23:50,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 905/10070 [26:02<4:23:43,  1.73s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 905/10070 [26:02<4:23:43,  1.73s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 906/10070 [26:03<4:23:31,  1.73s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   9%| | 906/10070 [26:03<4:23:31,  1.73s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 907/10070 [26:03<4:23:19,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 907/10070 [26:03<4:23:19,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 908/10070 [26:05<4:23:12,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 908/10070 [26:05<4:23:12,  1.72s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 909/10070 [26:06<4:23:10,  1.72s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:   9%| | 909/10070 [26:06<4:23:10,  1.72s/it, v_num=tif6, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 910/10070 [26:09<4:23:14,  1.72s/it, v_num=tif6, train/loss=1.1\r",
-      "Epoch 0:   9%| | 910/10070 [26:09<4:23:14,  1.72s/it, v_num=tif6, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 911/10070 [26:10<4:23:07,  1.72s/it, v_num=tif6, train/loss=3.3\r",
-      "Epoch 0:   9%| | 911/10070 [26:10<4:23:07,  1.72s/it, v_num=tif6, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 912/10070 [26:11<4:23:00,  1.72s/it, v_num=tif6, train/loss=0.7\r",
-      "Epoch 0:   9%| | 912/10070 [26:11<4:23:00,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 913/10070 [26:12<4:22:48,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   9%| | 913/10070 [26:12<4:22:48,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 914/10070 [26:13<4:22:46,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 914/10070 [26:13<4:22:46,  1.72s/it, v_num=tif6, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 915/10070 [26:15<4:22:45,  1.72s/it, v_num=tif6, train/loss=1.0\r",
-      "Epoch 0:   9%| | 915/10070 [26:15<4:22:45,  1.72s/it, v_num=tif6, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 916/10070 [26:16<4:22:38,  1.72s/it, v_num=tif6, train/loss=1.5\r",
-      "Epoch 0:   9%| | 916/10070 [26:16<4:22:38,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 917/10070 [26:19<4:22:42,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   9%| | 917/10070 [26:19<4:22:42,  1.72s/it, v_num=tif6, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 918/10070 [26:20<4:22:35,  1.72s/it, v_num=tif6, train/loss=2.2\r",
-      "Epoch 0:   9%| | 918/10070 [26:20<4:22:35,  1.72s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 919/10070 [26:22<4:22:39,  1.72s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:   9%| | 919/10070 [26:22<4:22:39,  1.72s/it, v_num=tif6, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 920/10070 [26:24<4:22:42,  1.72s/it, v_num=tif6, train/loss=2.5\r",
-      "Epoch 0:   9%| | 920/10070 [26:24<4:22:42,  1.72s/it, v_num=tif6, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 921/10070 [26:26<4:22:41,  1.72s/it, v_num=tif6, train/loss=2.5\r",
-      "Epoch 0:   9%| | 921/10070 [26:26<4:22:41,  1.72s/it, v_num=tif6, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 922/10070 [26:27<4:22:35,  1.72s/it, v_num=tif6, train/loss=0.9\r",
-      "Epoch 0:   9%| | 922/10070 [26:27<4:22:35,  1.72s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 923/10070 [26:28<4:22:23,  1.72s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   9%| | 923/10070 [26:28<4:22:23,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 924/10070 [26:29<4:22:11,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 924/10070 [26:29<4:22:11,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 925/10070 [26:31<4:22:14,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 925/10070 [26:31<4:22:14,  1.72s/it, v_num=tif6, train/loss=3.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 926/10070 [26:33<4:22:13,  1.72s/it, v_num=tif6, train/loss=3.3\r",
-      "Epoch 0:   9%| | 926/10070 [26:33<4:22:13,  1.72s/it, v_num=tif6, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 927/10070 [26:33<4:22:01,  1.72s/it, v_num=tif6, train/loss=2.0\r",
-      "Epoch 0:   9%| | 927/10070 [26:33<4:22:01,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 928/10070 [26:40<4:22:46,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 928/10070 [26:40<4:22:46,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 929/10070 [26:42<4:22:44,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 929/10070 [26:42<4:22:44,  1.72s/it, v_num=tif6, train/loss=1.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 930/10070 [26:42<4:22:32,  1.72s/it, v_num=tif6, train/loss=1.3\r",
-      "Epoch 0:   9%| | 930/10070 [26:42<4:22:32,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 931/10070 [26:44<4:22:26,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 931/10070 [26:44<4:22:26,  1.72s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 932/10070 [26:45<4:22:24,  1.72s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:   9%| | 932/10070 [26:45<4:22:24,  1.72s/it, v_num=tif6, train/loss=1.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 933/10070 [26:47<4:22:23,  1.72s/it, v_num=tif6, train/loss=1.1\r",
-      "Epoch 0:   9%| | 933/10070 [26:47<4:22:23,  1.72s/it, v_num=tif6, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 934/10070 [26:48<4:22:16,  1.72s/it, v_num=tif6, train/loss=1.4\r",
-      "Epoch 0:   9%| | 934/10070 [26:48<4:22:16,  1.72s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 935/10070 [26:50<4:22:15,  1.72s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:   9%| | 935/10070 [26:50<4:22:15,  1.72s/it, v_num=tif6, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 936/10070 [26:52<4:22:19,  1.72s/it, v_num=tif6, train/loss=1.7\r",
-      "Epoch 0:   9%| | 936/10070 [26:52<4:22:19,  1.72s/it, v_num=tif6, train/loss=2.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 937/10070 [26:54<4:22:12,  1.72s/it, v_num=tif6, train/loss=2.5\r",
-      "Epoch 0:   9%| | 937/10070 [26:54<4:22:12,  1.72s/it, v_num=tif6, train/loss=0.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 938/10070 [26:56<4:22:16,  1.72s/it, v_num=tif6, train/loss=0.4\r",
-      "Epoch 0:   9%| | 938/10070 [26:56<4:22:16,  1.72s/it, v_num=tif6, train/loss=3.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 939/10070 [26:57<4:22:04,  1.72s/it, v_num=tif6, train/loss=3.2\r",
-      "Epoch 0:   9%| | 939/10070 [26:57<4:22:04,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 940/10070 [26:59<4:22:08,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 940/10070 [26:59<4:22:08,  1.72s/it, v_num=tif6, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 941/10070 [27:00<4:22:02,  1.72s/it, v_num=tif6, train/loss=2.2\r",
-      "Epoch 0:   9%| | 941/10070 [27:00<4:22:02,  1.72s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 942/10070 [27:02<4:22:05,  1.72s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   9%| | 942/10070 [27:02<4:22:05,  1.72s/it, v_num=tif6, train/loss=2.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 943/10070 [27:04<4:22:03,  1.72s/it, v_num=tif6, train/loss=2.4\r",
-      "Epoch 0:   9%| | 943/10070 [27:04<4:22:03,  1.72s/it, v_num=tif6, train/loss=1.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 944/10070 [27:06<4:22:02,  1.72s/it, v_num=tif6, train/loss=1.2\r",
-      "Epoch 0:   9%| | 944/10070 [27:06<4:22:02,  1.72s/it, v_num=tif6, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 945/10070 [27:07<4:21:50,  1.72s/it, v_num=tif6, train/loss=1.5\r",
-      "Epoch 0:   9%| | 945/10070 [27:07<4:21:50,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 946/10070 [27:08<4:21:44,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 946/10070 [27:08<4:21:44,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 947/10070 [27:09<4:21:42,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 947/10070 [27:09<4:21:42,  1.72s/it, v_num=tif6, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 948/10070 [27:11<4:21:35,  1.72s/it, v_num=tif6, train/loss=0.9\r",
-      "Epoch 0:   9%| | 948/10070 [27:11<4:21:35,  1.72s/it, v_num=tif6, train/loss=0.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 949/10070 [27:12<4:21:29,  1.72s/it, v_num=tif6, train/loss=0.7\r",
-      "Epoch 0:   9%| | 949/10070 [27:12<4:21:29,  1.72s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 950/10070 [27:13<4:21:17,  1.72s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:   9%| | 950/10070 [27:13<4:21:17,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 951/10070 [27:14<4:21:11,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 951/10070 [27:14<4:21:11,  1.72s/it, v_num=tif6, train/loss=0.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 952/10070 [27:16<4:21:09,  1.72s/it, v_num=tif6, train/loss=0.2\r",
-      "Epoch 0:   9%| | 952/10070 [27:16<4:21:09,  1.72s/it, v_num=tif6, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 953/10070 [27:16<4:20:58,  1.72s/it, v_num=tif6, train/loss=1.7\r",
-      "Epoch 0:   9%| | 953/10070 [27:16<4:20:58,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 954/10070 [27:17<4:20:46,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 954/10070 [27:17<4:20:46,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 955/10070 [27:18<4:20:35,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 955/10070 [27:18<4:20:35,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:   9%| | 956/10070 [27:19<4:20:33,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:   9%| | 956/10070 [27:19<4:20:33,  1.72s/it, v_num=tif6, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 957/10070 [27:21<4:20:32,  1.72s/it, v_num=tif6, train/loss=1.5\r",
-      "Epoch 0:  10%| | 957/10070 [27:21<4:20:32,  1.72s/it, v_num=tif6, train/loss=1.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 958/10070 [27:23<4:20:30,  1.72s/it, v_num=tif6, train/loss=1.5\r",
-      "Epoch 0:  10%| | 958/10070 [27:23<4:20:30,  1.72s/it, v_num=tif6, train/loss=0.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 959/10070 [27:25<4:20:34,  1.72s/it, v_num=tif6, train/loss=0.9\r",
-      "Epoch 0:  10%| | 959/10070 [27:25<4:20:34,  1.72s/it, v_num=tif6, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 960/10070 [27:34<4:21:38,  1.72s/it, v_num=tif6, train/loss=3.1\r",
-      "Epoch 0:  10%| | 960/10070 [27:34<4:21:38,  1.72s/it, v_num=tif6, train/loss=2.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 961/10070 [27:35<4:21:36,  1.72s/it, v_num=tif6, train/loss=2.4\r",
-      "Epoch 0:  10%| | 961/10070 [27:35<4:21:36,  1.72s/it, v_num=tif6, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 962/10070 [27:37<4:21:29,  1.72s/it, v_num=tif6, train/loss=1.0\r",
-      "Epoch 0:  10%| | 962/10070 [27:37<4:21:29,  1.72s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 963/10070 [27:38<4:21:22,  1.72s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:  10%| | 963/10070 [27:38<4:21:22,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 964/10070 [27:40<4:21:21,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:  10%| | 964/10070 [27:40<4:21:21,  1.72s/it, v_num=tif6, train/loss=1.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 965/10070 [27:41<4:21:19,  1.72s/it, v_num=tif6, train/loss=1.4\r",
-      "Epoch 0:  10%| | 965/10070 [27:41<4:21:19,  1.72s/it, v_num=tif6, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 966/10070 [27:42<4:21:08,  1.72s/it, v_num=tif6, train/loss=2.0\r",
-      "Epoch 0:  10%| | 966/10070 [27:42<4:21:08,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 967/10070 [27:43<4:20:56,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:  10%| | 967/10070 [27:43<4:20:56,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 968/10070 [27:45<4:21:00,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:  10%| | 968/10070 [27:45<4:21:00,  1.72s/it, v_num=tif6, train/loss=2.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 969/10070 [27:46<4:20:48,  1.72s/it, v_num=tif6, train/loss=2.8\r",
-      "Epoch 0:  10%| | 969/10070 [27:46<4:20:48,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 970/10070 [27:46<4:20:37,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:  10%| | 970/10070 [27:46<4:20:37,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 971/10070 [27:49<4:20:40,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:  10%| | 971/10070 [27:49<4:20:40,  1.72s/it, v_num=tif6, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 972/10070 [27:49<4:20:28,  1.72s/it, v_num=tif6, train/loss=2.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 972/10070 [27:49<4:20:28,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 973/10070 [27:51<4:20:26,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:  10%| | 973/10070 [27:51<4:20:26,  1.72s/it, v_num=tif6, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 974/10070 [27:53<4:20:24,  1.72s/it, v_num=tif6, train/loss=1.7\r",
-      "Epoch 0:  10%| | 974/10070 [27:53<4:20:24,  1.72s/it, v_num=tif6, train/loss=1.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 975/10070 [27:53<4:20:13,  1.72s/it, v_num=tif6, train/loss=1.0\r",
-      "Epoch 0:  10%| | 975/10070 [27:53<4:20:13,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 976/10070 [27:54<4:20:01,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:  10%| | 976/10070 [27:54<4:20:01,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 977/10070 [27:56<4:20:04,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:  10%| | 977/10070 [27:56<4:20:04,  1.72s/it, v_num=tif6, train/loss=2.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 978/10070 [27:57<4:19:53,  1.72s/it, v_num=tif6, train/loss=2.1\r",
-      "Epoch 0:  10%| | 978/10070 [27:57<4:19:53,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 979/10070 [27:57<4:19:41,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:  10%| | 979/10070 [27:57<4:19:41,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 980/10070 [27:59<4:19:35,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:  10%| | 980/10070 [27:59<4:19:35,  1.71s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 981/10070 [28:01<4:19:38,  1.71s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:  10%| | 981/10070 [28:01<4:19:38,  1.71s/it, v_num=tif6, train/loss=2.2"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 982/10070 [28:02<4:19:26,  1.71s/it, v_num=tif6, train/loss=2.2\r",
-      "Epoch 0:  10%| | 982/10070 [28:02<4:19:26,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 983/10070 [28:04<4:19:29,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:  10%| | 983/10070 [28:04<4:19:29,  1.71s/it, v_num=tif6, train/loss=2.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 984/10070 [28:04<4:19:18,  1.71s/it, v_num=tif6, train/loss=2.3\r",
-      "Epoch 0:  10%| | 984/10070 [28:04<4:19:18,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 985/10070 [28:06<4:19:12,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:  10%| | 985/10070 [28:06<4:19:12,  1.71s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 986/10070 [28:07<4:19:05,  1.71s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:  10%| | 986/10070 [28:07<4:19:05,  1.71s/it, v_num=tif6, train/loss=0.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 987/10070 [28:08<4:18:54,  1.71s/it, v_num=tif6, train/loss=0.1\r",
-      "Epoch 0:  10%| | 987/10070 [28:08<4:18:54,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 988/10070 [28:08<4:18:43,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:  10%| | 988/10070 [28:08<4:18:43,  1.71s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 989/10070 [28:10<4:18:42,  1.71s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:  10%| | 989/10070 [28:10<4:18:42,  1.71s/it, v_num=tif6, train/loss=0.8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 990/10070 [28:11<4:18:35,  1.71s/it, v_num=tif6, train/loss=0.8\r",
-      "Epoch 0:  10%| | 990/10070 [28:11<4:18:35,  1.71s/it, v_num=tif6, train/loss=0.5"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 991/10070 [28:13<4:18:39,  1.71s/it, v_num=tif6, train/loss=0.5\r",
-      "Epoch 0:  10%| | 991/10070 [28:13<4:18:39,  1.71s/it, v_num=tif6, train/loss=3.1"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 992/10070 [28:28<4:20:31,  1.72s/it, v_num=tif6, train/loss=3.1\r",
-      "Epoch 0:  10%| | 992/10070 [28:28<4:20:31,  1.72s/it, v_num=tif6, train/loss=0.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 993/10070 [28:30<4:20:34,  1.72s/it, v_num=tif6, train/loss=0.6\r",
-      "Epoch 0:  10%| | 993/10070 [28:30<4:20:34,  1.72s/it, v_num=tif6, train/loss=2.6"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 994/10070 [28:32<4:20:38,  1.72s/it, v_num=tif6, train/loss=2.6\r",
-      "Epoch 0:  10%| | 994/10070 [28:32<4:20:38,  1.72s/it, v_num=tif6, train/loss=2.9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 995/10070 [28:34<4:20:40,  1.72s/it, v_num=tif6, train/loss=2.9\r",
-      "Epoch 0:  10%| | 995/10070 [28:34<4:20:40,  1.72s/it, v_num=tif6, train/loss=2.4"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 996/10070 [28:36<4:20:34,  1.72s/it, v_num=tif6, train/loss=2.4\r",
-      "Epoch 0:  10%| | 996/10070 [28:36<4:20:34,  1.72s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 997/10070 [28:36<4:20:22,  1.72s/it, v_num=tif6, train/loss=0.3\r",
-      "Epoch 0:  10%| | 997/10070 [28:36<4:20:22,  1.72s/it, v_num=tif6, train/loss=0.0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 998/10070 [28:38<4:20:20,  1.72s/it, v_num=tif6, train/loss=0.0\r",
-      "Epoch 0:  10%| | 998/10070 [28:38<4:20:20,  1.72s/it, v_num=tif6, train/loss=1.7"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 999/10070 [28:39<4:20:14,  1.72s/it, v_num=tif6, train/loss=1.7\r",
-      "Epoch 0:  10%| | 999/10070 [28:39<4:20:14,  1.72s/it, v_num=tif6, train/loss=0.3"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1000/10070 [28:40<4:20:07,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1000/10070 [28:40<4:20:07,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1001/10070 [28:42<4:20:05,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1001/10070 [28:42<4:20:05,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1002/10070 [28:43<4:19:54,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  10%| | 1002/10070 [28:43<4:19:54,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1003/10070 [28:45<4:19:57,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1003/10070 [28:45<4:19:57,  1.72s/it, v_num=tif6, train/loss=3."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1004/10070 [28:46<4:19:46,  1.72s/it, v_num=tif6, train/loss=3.\r",
-      "Epoch 0:  10%| | 1004/10070 [28:46<4:19:46,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1005/10070 [28:47<4:19:39,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1005/10070 [28:47<4:19:39,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1006/10070 [28:48<4:19:32,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1006/10070 [28:48<4:19:32,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1007/10070 [28:49<4:19:21,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1007/10070 [28:49<4:19:21,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1008/10070 [28:49<4:19:10,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1008/10070 [28:49<4:19:10,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1009/10070 [28:51<4:19:08,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1009/10070 [28:51<4:19:08,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1010/10070 [28:52<4:19:02,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1010/10070 [28:52<4:19:02,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1011/10070 [28:53<4:18:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1011/10070 [28:53<4:18:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1012/10070 [28:54<4:18:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1012/10070 [28:54<4:18:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1013/10070 [28:56<4:18:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1013/10070 [28:56<4:18:47,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1014/10070 [28:57<4:18:36,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  10%| | 1014/10070 [28:57<4:18:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1015/10070 [28:59<4:18:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1015/10070 [28:59<4:18:34,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1016/10070 [29:00<4:18:32,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  10%| | 1016/10070 [29:00<4:18:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1017/10070 [29:01<4:18:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1017/10070 [29:01<4:18:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1018/10070 [29:03<4:18:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1018/10070 [29:03<4:18:20,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1019/10070 [29:04<4:18:18,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  10%| | 1019/10070 [29:04<4:18:18,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1020/10070 [29:06<4:18:12,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  10%| | 1020/10070 [29:06<4:18:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1021/10070 [29:07<4:18:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1021/10070 [29:07<4:18:10,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1022/10070 [29:10<4:18:13,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  10%| | 1022/10070 [29:10<4:18:13,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1023/10070 [29:11<4:18:07,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  10%| | 1023/10070 [29:11<4:18:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1024/10070 [29:25<4:19:56,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1024/10070 [29:25<4:19:56,  1.72s/it, v_num=tif6, train/loss=3."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1025/10070 [29:27<4:19:59,  1.72s/it, v_num=tif6, train/loss=3.\r",
-      "Epoch 0:  10%| | 1025/10070 [29:27<4:19:59,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1026/10070 [29:28<4:19:49,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  10%| | 1026/10070 [29:28<4:19:49,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1027/10070 [29:29<4:19:42,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1027/10070 [29:29<4:19:42,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1028/10070 [29:30<4:19:36,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1028/10070 [29:30<4:19:36,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1029/10070 [29:32<4:19:30,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1029/10070 [29:32<4:19:30,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1030/10070 [29:34<4:19:33,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1030/10070 [29:34<4:19:33,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1031/10070 [29:35<4:19:26,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  10%| | 1031/10070 [29:35<4:19:26,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1032/10070 [29:37<4:19:24,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1032/10070 [29:37<4:19:24,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1033/10070 [29:37<4:19:14,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  10%| | 1033/10070 [29:37<4:19:14,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1034/10070 [29:38<4:19:03,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1034/10070 [29:38<4:19:03,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1035/10070 [29:39<4:18:56,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1035/10070 [29:39<4:18:56,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1036/10070 [29:40<4:18:46,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1036/10070 [29:40<4:18:46,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1037/10070 [29:41<4:18:35,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1037/10070 [29:41<4:18:35,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1038/10070 [29:42<4:18:33,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1038/10070 [29:42<4:18:33,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1039/10070 [29:44<4:18:27,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  10%| | 1039/10070 [29:44<4:18:27,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1040/10070 [29:45<4:18:20,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1040/10070 [29:45<4:18:20,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1041/10070 [29:47<4:18:23,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1041/10070 [29:47<4:18:23,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1042/10070 [29:48<4:18:17,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  10%| | 1042/10070 [29:48<4:18:17,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1043/10070 [29:49<4:18:06,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1043/10070 [29:49<4:18:06,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1044/10070 [29:51<4:18:09,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1044/10070 [29:51<4:18:09,  1.72s/it, v_num=tif6, train/loss=3."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1045/10070 [29:53<4:18:12,  1.72s/it, v_num=tif6, train/loss=3.\r",
-      "Epoch 0:  10%| | 1045/10070 [29:53<4:18:12,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1046/10070 [29:55<4:18:06,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  10%| | 1046/10070 [29:55<4:18:06,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1047/10070 [29:57<4:18:09,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1047/10070 [29:57<4:18:09,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1048/10070 [29:57<4:17:58,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  10%| | 1048/10070 [29:57<4:17:58,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1049/10070 [30:00<4:18:01,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1049/10070 [30:00<4:18:01,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1050/10070 [30:02<4:18:04,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  10%| | 1050/10070 [30:02<4:18:04,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1051/10070 [30:04<4:18:02,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  10%| | 1051/10070 [30:04<4:18:02,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1052/10070 [30:05<4:18:01,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  10%| | 1052/10070 [30:05<4:18:01,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1053/10070 [30:07<4:17:54,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  10%| | 1053/10070 [30:07<4:17:54,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1054/10070 [30:07<4:17:44,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1054/10070 [30:07<4:17:44,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1055/10070 [30:10<4:17:47,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1055/10070 [30:10<4:17:47,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1056/10070 [30:21<4:19:11,  1.73s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  10%| | 1056/10070 [30:21<4:19:11,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  10%| | 1057/10070 [30:23<4:19:05,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  10%| | 1057/10070 [30:23<4:19:05,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1058/10070 [30:25<4:19:08,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1058/10070 [30:25<4:19:08,  1.73s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1059/10070 [30:27<4:19:10,  1.73s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  11%| | 1059/10070 [30:27<4:19:10,  1.73s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1060/10070 [30:29<4:19:13,  1.73s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  11%| | 1060/10070 [30:29<4:19:13,  1.73s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1061/10070 [30:31<4:19:11,  1.73s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  11%| | 1061/10070 [30:31<4:19:11,  1.73s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1062/10070 [30:32<4:19:05,  1.73s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1062/10070 [30:32<4:19:05,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1063/10070 [30:33<4:18:59,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1063/10070 [30:33<4:18:59,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1064/10070 [30:34<4:18:48,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1064/10070 [30:34<4:18:48,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1065/10070 [30:35<4:18:38,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1065/10070 [30:35<4:18:38,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1066/10070 [30:37<4:18:40,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1066/10070 [30:37<4:18:40,  1.72s/it, v_num=tif6, train/loss=3."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1067/10070 [30:38<4:18:30,  1.72s/it, v_num=tif6, train/loss=3.\r",
-      "Epoch 0:  11%| | 1067/10070 [30:38<4:18:30,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1068/10070 [30:39<4:18:28,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1068/10070 [30:39<4:18:28,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1069/10070 [30:41<4:18:22,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1069/10070 [30:41<4:18:22,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1070/10070 [30:42<4:18:20,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1070/10070 [30:42<4:18:20,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1071/10070 [30:44<4:18:14,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1071/10070 [30:44<4:18:14,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1072/10070 [30:44<4:18:03,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1072/10070 [30:44<4:18:03,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1073/10070 [30:45<4:17:53,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1073/10070 [30:45<4:17:53,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1074/10070 [30:46<4:17:47,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1074/10070 [30:46<4:17:47,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1075/10070 [30:47<4:17:41,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1075/10070 [30:47<4:17:41,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1076/10070 [30:49<4:17:35,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1076/10070 [30:49<4:17:35,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1077/10070 [30:50<4:17:33,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1077/10070 [30:50<4:17:33,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1078/10070 [30:52<4:17:31,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1078/10070 [30:52<4:17:31,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1079/10070 [30:54<4:17:30,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1079/10070 [30:54<4:17:30,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1080/10070 [30:54<4:17:19,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1080/10070 [30:54<4:17:19,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1081/10070 [30:55<4:17:09,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1081/10070 [30:55<4:17:09,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1082/10070 [30:56<4:16:59,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1082/10070 [30:56<4:16:59,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1083/10070 [30:56<4:16:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1083/10070 [30:56<4:16:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1084/10070 [30:58<4:16:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1084/10070 [30:58<4:16:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1085/10070 [30:59<4:16:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1085/10070 [30:59<4:16:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1086/10070 [31:01<4:16:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1086/10070 [31:01<4:16:35,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1087/10070 [31:03<4:16:38,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1087/10070 [31:03<4:16:38,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1088/10070 [31:15<4:18:04,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1088/10070 [31:15<4:18:04,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1089/10070 [31:17<4:18:02,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1089/10070 [31:17<4:18:02,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1090/10070 [31:19<4:18:00,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1090/10070 [31:19<4:18:00,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1091/10070 [31:19<4:17:50,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1091/10070 [31:19<4:17:50,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1092/10070 [31:20<4:17:40,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1092/10070 [31:20<4:17:40,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1093/10070 [31:21<4:17:34,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1093/10070 [31:21<4:17:34,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1094/10070 [31:22<4:17:23,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1094/10070 [31:22<4:17:23,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1095/10070 [31:23<4:17:13,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1095/10070 [31:23<4:17:13,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1096/10070 [31:24<4:17:12,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1096/10070 [31:24<4:17:12,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1097/10070 [31:25<4:17:02,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1097/10070 [31:25<4:17:02,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1098/10070 [31:27<4:17:04,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1098/10070 [31:27<4:17:04,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1099/10070 [31:29<4:17:03,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  11%| | 1099/10070 [31:29<4:17:03,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1100/10070 [31:30<4:16:57,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1100/10070 [31:30<4:16:57,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1101/10070 [31:32<4:17:00,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1101/10070 [31:32<4:17:00,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1102/10070 [31:34<4:16:54,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1102/10070 [31:34<4:16:54,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1103/10070 [31:34<4:16:44,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1103/10070 [31:34<4:16:44,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1104/10070 [31:36<4:16:38,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1104/10070 [31:36<4:16:38,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1105/10070 [31:38<4:16:41,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1105/10070 [31:38<4:16:41,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1106/10070 [31:40<4:16:44,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1106/10070 [31:40<4:16:44,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1107/10070 [31:41<4:16:33,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  11%| | 1107/10070 [31:41<4:16:33,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1108/10070 [31:41<4:16:23,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1108/10070 [31:41<4:16:23,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1109/10070 [31:43<4:16:18,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1109/10070 [31:43<4:16:18,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1110/10070 [31:44<4:16:16,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1110/10070 [31:44<4:16:16,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1111/10070 [31:46<4:16:10,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1111/10070 [31:46<4:16:10,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1112/10070 [31:46<4:16:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1112/10070 [31:46<4:16:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1113/10070 [31:49<4:16:03,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1113/10070 [31:49<4:16:03,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1114/10070 [31:50<4:15:57,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  11%| | 1114/10070 [31:50<4:15:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1115/10070 [31:52<4:15:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1115/10070 [31:52<4:15:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1116/10070 [31:53<4:15:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1116/10070 [31:53<4:15:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1117/10070 [31:53<4:15:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1117/10070 [31:53<4:15:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1118/10070 [31:54<4:15:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1118/10070 [31:54<4:15:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1119/10070 [31:55<4:15:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1119/10070 [31:55<4:15:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1120/10070 [32:12<4:17:21,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1120/10070 [32:12<4:17:21,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1121/10070 [32:12<4:17:11,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1121/10070 [32:12<4:17:11,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1122/10070 [32:14<4:17:05,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1122/10070 [32:14<4:17:05,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1123/10070 [32:14<4:16:55,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1123/10070 [32:14<4:16:55,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1124/10070 [32:16<4:16:53,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1124/10070 [32:16<4:16:53,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1125/10070 [32:17<4:16:43,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1125/10070 [32:17<4:16:43,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1126/10070 [32:17<4:16:33,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1126/10070 [32:17<4:16:33,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1127/10070 [32:18<4:16:23,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1127/10070 [32:18<4:16:23,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1128/10070 [32:20<4:16:21,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1128/10070 [32:20<4:16:21,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1129/10070 [32:22<4:16:23,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1129/10070 [32:22<4:16:23,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1130/10070 [32:24<4:16:25,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1130/10070 [32:24<4:16:25,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1131/10070 [32:25<4:16:19,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  11%| | 1131/10070 [32:25<4:16:19,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1132/10070 [32:28<4:16:21,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1132/10070 [32:28<4:16:21,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1133/10070 [32:28<4:16:11,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  11%| | 1133/10070 [32:28<4:16:11,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1134/10070 [32:31<4:16:14,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1134/10070 [32:31<4:16:14,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1135/10070 [32:32<4:16:08,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1135/10070 [32:32<4:16:08,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1136/10070 [32:32<4:15:58,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1136/10070 [32:32<4:15:58,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1137/10070 [32:34<4:15:53,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1137/10070 [32:34<4:15:53,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1138/10070 [32:35<4:15:47,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1138/10070 [32:35<4:15:47,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1139/10070 [32:36<4:15:37,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1139/10070 [32:36<4:15:37,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1140/10070 [32:37<4:15:36,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1140/10070 [32:37<4:15:36,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1141/10070 [32:38<4:15:26,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1141/10070 [32:38<4:15:26,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1142/10070 [32:40<4:15:24,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1142/10070 [32:40<4:15:24,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1143/10070 [32:41<4:15:18,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1143/10070 [32:41<4:15:18,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1144/10070 [32:42<4:15:08,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1144/10070 [32:42<4:15:08,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1145/10070 [32:43<4:15:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1145/10070 [32:43<4:15:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1146/10070 [32:44<4:15:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1146/10070 [32:44<4:15:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1147/10070 [32:45<4:14:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1147/10070 [32:45<4:14:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1148/10070 [32:47<4:14:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1148/10070 [32:47<4:14:50,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1149/10070 [32:49<4:14:48,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1149/10070 [32:49<4:14:48,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1150/10070 [32:51<4:14:50,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1150/10070 [32:51<4:14:50,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1151/10070 [32:53<4:14:53,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  11%| | 1151/10070 [32:53<4:14:53,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1152/10070 [33:07<4:16:25,  1.73s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  11%| | 1152/10070 [33:07<4:16:25,  1.73s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1153/10070 [33:08<4:16:15,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  11%| | 1153/10070 [33:08<4:16:15,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1154/10070 [33:09<4:16:13,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1154/10070 [33:09<4:16:13,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1155/10070 [33:12<4:16:16,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1155/10070 [33:12<4:16:16,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1156/10070 [33:12<4:16:06,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  11%| | 1156/10070 [33:12<4:16:06,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1157/10070 [33:15<4:16:09,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  11%| | 1157/10070 [33:15<4:16:09,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  11%| | 1158/10070 [33:15<4:15:59,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  11%| | 1158/10070 [33:15<4:15:59,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1159/10070 [33:17<4:15:57,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1159/10070 [33:17<4:15:57,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1160/10070 [33:19<4:15:56,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1160/10070 [33:19<4:15:56,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1161/10070 [33:21<4:15:58,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1161/10070 [33:21<4:15:58,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1162/10070 [33:22<4:15:53,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  12%| | 1162/10070 [33:22<4:15:53,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1163/10070 [33:25<4:15:55,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1163/10070 [33:25<4:15:55,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1164/10070 [33:25<4:15:45,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1164/10070 [33:25<4:15:45,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1165/10070 [33:26<4:15:36,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1165/10070 [33:26<4:15:36,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1166/10070 [33:27<4:15:26,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1166/10070 [33:27<4:15:26,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1167/10070 [33:28<4:15:21,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1167/10070 [33:28<4:15:21,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1168/10070 [33:30<4:15:24,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1168/10070 [33:30<4:15:24,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1169/10070 [33:31<4:15:15,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1169/10070 [33:31<4:15:15,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1170/10070 [33:33<4:15:13,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1170/10070 [33:33<4:15:13,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1171/10070 [33:33<4:15:03,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1171/10070 [33:33<4:15:03,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1172/10070 [33:36<4:15:06,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1172/10070 [33:36<4:15:06,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1173/10070 [33:36<4:14:56,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  12%| | 1173/10070 [33:36<4:14:56,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1174/10070 [33:37<4:14:47,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1174/10070 [33:37<4:14:47,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1175/10070 [33:39<4:14:45,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1175/10070 [33:39<4:14:45,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1176/10070 [33:40<4:14:44,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1176/10070 [33:40<4:14:44,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1177/10070 [33:42<4:14:38,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1177/10070 [33:42<4:14:38,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1178/10070 [33:42<4:14:29,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1178/10070 [33:42<4:14:29,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1179/10070 [33:45<4:14:31,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1179/10070 [33:45<4:14:31,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1180/10070 [33:46<4:14:29,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1180/10070 [33:46<4:14:29,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1181/10070 [33:47<4:14:20,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1181/10070 [33:47<4:14:20,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1182/10070 [33:48<4:14:10,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1182/10070 [33:48<4:14:10,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1183/10070 [33:49<4:14:05,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1183/10070 [33:49<4:14:05,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1184/10070 [34:04<4:15:42,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1184/10070 [34:04<4:15:42,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1185/10070 [34:05<4:15:37,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1185/10070 [34:05<4:15:37,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1186/10070 [34:07<4:15:39,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1186/10070 [34:07<4:15:39,  1.73s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1187/10070 [34:09<4:15:34,  1.73s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1187/10070 [34:09<4:15:34,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1188/10070 [34:09<4:15:24,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1188/10070 [34:09<4:15:24,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1189/10070 [34:11<4:15:22,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1189/10070 [34:11<4:15:22,  1.73s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1190/10070 [34:12<4:15:17,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1190/10070 [34:12<4:15:17,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1191/10070 [34:14<4:15:15,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1191/10070 [34:14<4:15:15,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1192/10070 [34:15<4:15:09,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1192/10070 [34:15<4:15:09,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1193/10070 [34:16<4:15:03,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1193/10070 [34:16<4:15:03,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1194/10070 [34:18<4:15:02,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1194/10070 [34:18<4:15:02,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1195/10070 [34:19<4:14:56,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1195/10070 [34:19<4:14:56,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1196/10070 [34:21<4:14:55,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1196/10070 [34:21<4:14:55,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1197/10070 [34:23<4:14:57,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1197/10070 [34:23<4:14:57,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1198/10070 [34:24<4:14:51,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  12%| | 1198/10070 [34:24<4:14:51,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1199/10070 [34:26<4:14:46,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1199/10070 [34:26<4:14:46,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1200/10070 [34:26<4:14:36,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1200/10070 [34:26<4:14:36,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1201/10070 [34:27<4:14:27,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1201/10070 [34:27<4:14:27,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1202/10070 [34:28<4:14:18,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1202/10070 [34:28<4:14:18,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1203/10070 [34:29<4:14:12,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1203/10070 [34:29<4:14:12,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1204/10070 [34:30<4:14:03,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1204/10070 [34:30<4:14:03,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1205/10070 [34:31<4:13:57,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1205/10070 [34:31<4:13:57,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1206/10070 [34:32<4:13:52,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1206/10070 [34:32<4:13:52,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1207/10070 [34:33<4:13:42,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1207/10070 [34:33<4:13:42,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1208/10070 [34:34<4:13:41,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1208/10070 [34:34<4:13:41,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1209/10070 [34:36<4:13:39,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1209/10070 [34:36<4:13:39,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1210/10070 [34:37<4:13:30,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1210/10070 [34:37<4:13:30,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1211/10070 [34:38<4:13:28,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1211/10070 [34:38<4:13:28,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1212/10070 [34:40<4:13:26,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1212/10070 [34:40<4:13:26,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1213/10070 [34:41<4:13:21,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1213/10070 [34:41<4:13:21,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1214/10070 [34:42<4:13:12,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1214/10070 [34:42<4:13:12,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1215/10070 [34:43<4:13:06,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1215/10070 [34:43<4:13:06,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1216/10070 [35:00<4:14:53,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1216/10070 [35:00<4:14:53,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1217/10070 [35:01<4:14:48,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1217/10070 [35:01<4:14:48,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1218/10070 [35:03<4:14:46,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1218/10070 [35:03<4:14:46,  1.73s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1219/10070 [35:05<4:14:45,  1.73s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1219/10070 [35:05<4:14:45,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1220/10070 [35:07<4:14:47,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1220/10070 [35:07<4:14:47,  1.73s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1221/10070 [35:09<4:14:46,  1.73s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  12%| | 1221/10070 [35:09<4:14:46,  1.73s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1222/10070 [35:10<4:14:44,  1.73s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1222/10070 [35:10<4:14:44,  1.73s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1223/10070 [35:11<4:14:35,  1.73s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1223/10070 [35:11<4:14:35,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1224/10070 [35:12<4:14:30,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1224/10070 [35:12<4:14:30,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1225/10070 [35:14<4:14:24,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1225/10070 [35:14<4:14:24,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1226/10070 [35:15<4:14:19,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1226/10070 [35:15<4:14:19,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1227/10070 [35:16<4:14:10,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1227/10070 [35:16<4:14:10,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1228/10070 [35:17<4:14:05,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1228/10070 [35:17<4:14:05,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1229/10070 [35:19<4:14:07,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1229/10070 [35:19<4:14:07,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1230/10070 [35:20<4:13:58,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  12%| | 1230/10070 [35:20<4:13:58,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1231/10070 [35:21<4:13:52,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1231/10070 [35:21<4:13:52,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1232/10070 [35:22<4:13:43,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1232/10070 [35:22<4:13:43,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1233/10070 [35:23<4:13:42,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1233/10070 [35:23<4:13:42,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1234/10070 [35:24<4:13:33,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1234/10070 [35:24<4:13:33,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1235/10070 [35:25<4:13:27,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1235/10070 [35:25<4:13:27,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1236/10070 [35:27<4:13:26,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1236/10070 [35:27<4:13:26,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1237/10070 [35:28<4:13:20,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1237/10070 [35:28<4:13:20,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1238/10070 [35:29<4:13:11,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1238/10070 [35:29<4:13:11,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1239/10070 [35:30<4:13:02,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1239/10070 [35:30<4:13:02,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1240/10070 [35:31<4:12:57,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1240/10070 [35:31<4:12:57,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1241/10070 [35:32<4:12:48,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1241/10070 [35:32<4:12:48,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1242/10070 [35:34<4:12:51,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1242/10070 [35:34<4:12:51,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1243/10070 [35:35<4:12:42,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1243/10070 [35:35<4:12:42,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1244/10070 [35:36<4:12:40,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1244/10070 [35:36<4:12:40,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1245/10070 [35:39<4:12:43,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1245/10070 [35:39<4:12:43,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1246/10070 [35:39<4:12:34,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  12%| | 1246/10070 [35:39<4:12:34,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1247/10070 [35:41<4:12:32,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1247/10070 [35:41<4:12:32,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1248/10070 [35:55<4:13:56,  1.73s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1248/10070 [35:55<4:13:56,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1249/10070 [35:57<4:13:55,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1249/10070 [35:57<4:13:55,  1.73s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1250/10070 [35:58<4:13:53,  1.73s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1250/10070 [35:58<4:13:53,  1.73s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1251/10070 [35:59<4:13:44,  1.73s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1251/10070 [35:59<4:13:44,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1252/10070 [36:00<4:13:39,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1252/10070 [36:00<4:13:39,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1253/10070 [36:02<4:13:37,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1253/10070 [36:02<4:13:37,  1.73s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1254/10070 [36:03<4:13:28,  1.73s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1254/10070 [36:03<4:13:28,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1255/10070 [36:05<4:13:27,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1255/10070 [36:05<4:13:27,  1.73s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1256/10070 [36:07<4:13:29,  1.73s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  12%| | 1256/10070 [36:07<4:13:29,  1.73s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1257/10070 [36:08<4:13:23,  1.73s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  12%| | 1257/10070 [36:08<4:13:23,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  12%| | 1258/10070 [36:09<4:13:18,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  12%| | 1258/10070 [36:09<4:13:18,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1259/10070 [36:10<4:13:12,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1259/10070 [36:10<4:13:12,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1260/10070 [36:12<4:13:07,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1260/10070 [36:12<4:13:07,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1261/10070 [36:12<4:12:58,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1261/10070 [36:12<4:12:58,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1262/10070 [36:15<4:13:00,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1262/10070 [36:15<4:13:00,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1263/10070 [36:16<4:12:55,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  13%|▏| 1263/10070 [36:16<4:12:55,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1264/10070 [36:17<4:12:50,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1264/10070 [36:17<4:12:50,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1265/10070 [36:18<4:12:41,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1265/10070 [36:18<4:12:41,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1266/10070 [36:18<4:12:32,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1266/10070 [36:18<4:12:32,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1267/10070 [36:21<4:12:34,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1267/10070 [36:21<4:12:34,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1268/10070 [36:22<4:12:32,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  13%|▏| 1268/10070 [36:22<4:12:32,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1269/10070 [36:24<4:12:27,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1269/10070 [36:24<4:12:27,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1270/10070 [36:24<4:12:18,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1270/10070 [36:24<4:12:18,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1271/10070 [36:25<4:12:09,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1271/10070 [36:25<4:12:09,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1272/10070 [36:27<4:12:11,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1272/10070 [36:27<4:12:11,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1273/10070 [36:28<4:12:02,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  13%|▏| 1273/10070 [36:28<4:12:02,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1274/10070 [36:29<4:11:54,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1274/10070 [36:29<4:11:54,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1275/10070 [36:29<4:11:45,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1275/10070 [36:29<4:11:45,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1276/10070 [36:32<4:11:47,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1276/10070 [36:32<4:11:47,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1277/10070 [36:33<4:11:41,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  13%|▏| 1277/10070 [36:33<4:11:41,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1278/10070 [36:34<4:11:36,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1278/10070 [36:34<4:11:36,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1279/10070 [36:35<4:11:27,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1279/10070 [36:35<4:11:27,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1280/10070 [36:48<4:12:48,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1280/10070 [36:48<4:12:48,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1281/10070 [36:50<4:12:43,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1281/10070 [36:50<4:12:43,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1282/10070 [36:51<4:12:41,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1282/10070 [36:51<4:12:41,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1283/10070 [36:54<4:12:43,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1283/10070 [36:54<4:12:43,  1.73s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1284/10070 [36:56<4:12:45,  1.73s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  13%|▏| 1284/10070 [36:56<4:12:45,  1.73s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1285/10070 [36:56<4:12:36,  1.73s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 1285/10070 [36:57<4:12:36,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1286/10070 [36:57<4:12:27,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1286/10070 [36:57<4:12:27,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1287/10070 [36:59<4:12:25,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1287/10070 [36:59<4:12:25,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1288/10070 [37:01<4:12:27,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1288/10070 [37:01<4:12:27,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1289/10070 [37:02<4:12:18,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 1289/10070 [37:02<4:12:18,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1290/10070 [37:03<4:12:12,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1290/10070 [37:03<4:12:12,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1291/10070 [37:04<4:12:07,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1291/10070 [37:04<4:12:07,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1292/10070 [37:05<4:11:58,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1292/10070 [37:05<4:11:58,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1293/10070 [37:05<4:11:49,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1293/10070 [37:05<4:11:49,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1294/10070 [37:08<4:11:51,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1294/10070 [37:08<4:11:51,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1295/10070 [37:10<4:11:52,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  13%|▏| 1295/10070 [37:10<4:11:52,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1296/10070 [37:12<4:11:50,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  13%|▏| 1296/10070 [37:12<4:11:50,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1297/10070 [37:13<4:11:45,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 1297/10070 [37:13<4:11:45,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1298/10070 [37:14<4:11:40,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1298/10070 [37:14<4:11:40,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1299/10070 [37:16<4:11:38,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1299/10070 [37:16<4:11:38,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1300/10070 [37:16<4:11:29,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 1300/10070 [37:16<4:11:29,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1301/10070 [37:18<4:11:27,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1301/10070 [37:18<4:11:27,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1302/10070 [37:19<4:11:19,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 1302/10070 [37:19<4:11:19,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1303/10070 [37:21<4:11:20,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1303/10070 [37:21<4:11:20,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1304/10070 [37:23<4:11:18,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 1304/10070 [37:23<4:11:18,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1305/10070 [37:24<4:11:16,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1305/10070 [37:24<4:11:16,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1306/10070 [37:25<4:11:07,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1306/10070 [37:25<4:11:07,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1307/10070 [37:26<4:10:58,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1307/10070 [37:26<4:10:58,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1308/10070 [37:28<4:11:00,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1308/10070 [37:28<4:11:00,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1309/10070 [37:29<4:10:54,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  13%|▏| 1309/10070 [37:29<4:10:54,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1310/10070 [37:31<4:10:53,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1310/10070 [37:31<4:10:53,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1311/10070 [37:31<4:10:44,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 1311/10070 [37:31<4:10:44,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1312/10070 [37:39<4:11:23,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1312/10070 [37:39<4:11:23,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1313/10070 [37:41<4:11:21,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1313/10070 [37:41<4:11:21,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1314/10070 [37:43<4:11:20,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 1314/10070 [37:43<4:11:20,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1315/10070 [37:43<4:11:11,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1315/10070 [37:43<4:11:11,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1316/10070 [37:46<4:11:13,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1316/10070 [37:46<4:11:13,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1317/10070 [37:46<4:11:04,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  13%|▏| 1317/10070 [37:46<4:11:04,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1318/10070 [37:47<4:10:56,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1318/10070 [37:47<4:10:56,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1319/10070 [37:49<4:10:54,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1319/10070 [37:49<4:10:54,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1320/10070 [37:49<4:10:46,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 1320/10070 [37:49<4:10:46,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1321/10070 [37:51<4:10:41,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1321/10070 [37:51<4:10:41,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1322/10070 [37:51<4:10:32,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1322/10070 [37:51<4:10:32,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1323/10070 [37:52<4:10:24,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1323/10070 [37:52<4:10:24,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1324/10070 [37:54<4:10:26,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1324/10070 [37:54<4:10:26,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1325/10070 [37:57<4:10:28,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  13%|▏| 1325/10070 [37:57<4:10:28,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1326/10070 [37:58<4:10:23,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 1326/10070 [37:58<4:10:23,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1327/10070 [37:59<4:10:17,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1327/10070 [37:59<4:10:17,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1328/10070 [38:00<4:10:09,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1328/10070 [38:00<4:10:09,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1329/10070 [38:01<4:10:04,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1329/10070 [38:01<4:10:04,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1330/10070 [38:03<4:10:06,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1330/10070 [38:03<4:10:06,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1331/10070 [38:05<4:10:08,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  13%|▏| 1331/10070 [38:05<4:10:08,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1332/10070 [38:06<4:09:59,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  13%|▏| 1332/10070 [38:06<4:09:59,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1333/10070 [38:07<4:09:51,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1333/10070 [38:07<4:09:51,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1334/10070 [38:07<4:09:42,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1334/10070 [38:07<4:09:42,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1335/10070 [38:09<4:09:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1335/10070 [38:09<4:09:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1336/10070 [38:10<4:09:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1336/10070 [38:10<4:09:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1337/10070 [38:12<4:09:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1337/10070 [38:12<4:09:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1338/10070 [38:13<4:09:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1338/10070 [38:13<4:09:29,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1339/10070 [38:16<4:09:31,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 1339/10070 [38:16<4:09:31,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1340/10070 [38:16<4:09:23,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 1340/10070 [38:16<4:09:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1341/10070 [38:17<4:09:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1341/10070 [38:17<4:09:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1342/10070 [38:18<4:09:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1342/10070 [38:18<4:09:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1343/10070 [38:19<4:09:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1343/10070 [38:19<4:09:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1344/10070 [38:35<4:10:35,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1344/10070 [38:35<4:10:35,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1345/10070 [38:37<4:10:33,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1345/10070 [38:37<4:10:33,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1346/10070 [38:38<4:10:25,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1346/10070 [38:38<4:10:25,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1347/10070 [38:38<4:10:16,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1347/10070 [38:38<4:10:16,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1348/10070 [38:39<4:10:07,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1348/10070 [38:39<4:10:07,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1349/10070 [38:40<4:09:59,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1349/10070 [38:40<4:09:59,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1350/10070 [38:41<4:09:57,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1350/10070 [38:41<4:09:57,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1351/10070 [38:43<4:09:55,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1351/10070 [38:43<4:09:55,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1352/10070 [38:44<4:09:47,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 1352/10070 [38:44<4:09:47,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1353/10070 [38:45<4:09:42,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1353/10070 [38:45<4:09:42,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1354/10070 [38:47<4:09:40,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1354/10070 [38:47<4:09:40,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1355/10070 [38:47<4:09:31,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 1355/10070 [38:47<4:09:31,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1356/10070 [38:49<4:09:26,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1356/10070 [38:49<4:09:26,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1357/10070 [38:51<4:09:28,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1357/10070 [38:51<4:09:28,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1358/10070 [38:52<4:09:23,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  13%|▏| 1358/10070 [38:52<4:09:23,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  13%|▏| 1359/10070 [38:53<4:09:17,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  13%|▏| 1359/10070 [38:53<4:09:17,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1360/10070 [38:54<4:09:09,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1360/10070 [38:54<4:09:09,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1361/10070 [38:56<4:09:10,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1361/10070 [38:56<4:09:11,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1362/10070 [38:57<4:09:05,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  14%|▏| 1362/10070 [38:57<4:09:05,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1363/10070 [38:58<4:08:57,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1363/10070 [38:58<4:08:57,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1364/10070 [38:59<4:08:52,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1364/10070 [38:59<4:08:52,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1365/10070 [39:00<4:08:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1365/10070 [39:00<4:08:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1366/10070 [39:01<4:08:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1366/10070 [39:01<4:08:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1367/10070 [39:03<4:08:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1367/10070 [39:03<4:08:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1368/10070 [39:04<4:08:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1368/10070 [39:04<4:08:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1369/10070 [39:06<4:08:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1369/10070 [39:06<4:08:33,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1370/10070 [39:08<4:08:34,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 1370/10070 [39:08<4:08:34,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1371/10070 [39:09<4:08:29,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  14%|▏| 1371/10070 [39:09<4:08:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1372/10070 [39:10<4:08:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1372/10070 [39:10<4:08:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1373/10070 [39:12<4:08:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1373/10070 [39:12<4:08:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1374/10070 [39:13<4:08:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1374/10070 [39:13<4:08:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1375/10070 [39:15<4:08:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1375/10070 [39:15<4:08:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1376/10070 [39:29<4:09:31,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1376/10070 [39:29<4:09:31,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1377/10070 [39:30<4:09:23,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1377/10070 [39:30<4:09:23,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1378/10070 [39:32<4:09:21,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1378/10070 [39:32<4:09:22,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1379/10070 [39:33<4:09:17,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 1379/10070 [39:33<4:09:17,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1380/10070 [39:35<4:09:15,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1380/10070 [39:35<4:09:15,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1381/10070 [39:35<4:09:07,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 1381/10070 [39:35<4:09:07,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1382/10070 [39:36<4:09:02,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1382/10070 [39:36<4:09:03,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1383/10070 [39:37<4:08:54,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1383/10070 [39:37<4:08:54,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1384/10070 [39:39<4:08:53,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1384/10070 [39:39<4:08:53,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1385/10070 [39:40<4:08:45,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1385/10070 [39:40<4:08:45,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1386/10070 [39:40<4:08:37,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1386/10070 [39:40<4:08:37,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1387/10070 [39:42<4:08:35,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1387/10070 [39:42<4:08:35,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1388/10070 [39:44<4:08:37,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1388/10070 [39:44<4:08:37,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1389/10070 [39:47<4:08:39,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  14%|▏| 1389/10070 [39:47<4:08:39,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1390/10070 [39:47<4:08:31,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  14%|▏| 1390/10070 [39:47<4:08:31,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1391/10070 [39:49<4:08:26,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1391/10070 [39:49<4:08:26,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1392/10070 [39:50<4:08:21,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1392/10070 [39:50<4:08:21,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1393/10070 [39:50<4:08:13,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1393/10070 [39:50<4:08:13,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1394/10070 [39:51<4:08:05,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1394/10070 [39:51<4:08:05,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1395/10070 [39:52<4:08:00,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1395/10070 [39:52<4:08:00,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1396/10070 [39:55<4:08:02,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1396/10070 [39:55<4:08:02,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1397/10070 [39:55<4:07:54,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  14%|▏| 1397/10070 [39:55<4:07:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1398/10070 [39:58<4:07:55,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1398/10070 [39:58<4:07:55,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1399/10070 [39:59<4:07:54,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  14%|▏| 1399/10070 [39:59<4:07:54,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1400/10070 [40:01<4:07:49,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 1400/10070 [40:01<4:07:49,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1401/10070 [40:02<4:07:48,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1401/10070 [40:02<4:07:48,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1402/10070 [40:03<4:07:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1402/10070 [40:03<4:07:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1403/10070 [40:05<4:07:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1403/10070 [40:05<4:07:42,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1404/10070 [40:07<4:07:37,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  14%|▏| 1404/10070 [40:07<4:07:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1405/10070 [40:08<4:07:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1405/10070 [40:08<4:07:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1406/10070 [40:08<4:07:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1406/10070 [40:08<4:07:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1407/10070 [40:10<4:07:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1407/10070 [40:10<4:07:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1408/10070 [40:20<4:08:11,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1408/10070 [40:20<4:08:11,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1409/10070 [40:21<4:08:03,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  14%|▏| 1409/10070 [40:21<4:08:03,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1410/10070 [40:21<4:07:55,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1410/10070 [40:21<4:07:55,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1411/10070 [40:22<4:07:47,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1411/10070 [40:22<4:07:47,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1412/10070 [40:23<4:07:39,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1412/10070 [40:23<4:07:39,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1413/10070 [40:25<4:07:40,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1413/10070 [40:25<4:07:40,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1414/10070 [40:26<4:07:36,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 1414/10070 [40:26<4:07:36,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1415/10070 [40:28<4:07:31,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1415/10070 [40:28<4:07:31,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1416/10070 [40:29<4:07:26,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1416/10070 [40:29<4:07:26,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1417/10070 [40:30<4:07:21,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1417/10070 [40:30<4:07:21,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1418/10070 [40:31<4:07:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1418/10070 [40:31<4:07:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1419/10070 [40:32<4:07:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1419/10070 [40:32<4:07:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1420/10070 [40:33<4:07:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1420/10070 [40:33<4:07:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1421/10070 [40:34<4:06:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1421/10070 [40:34<4:06:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1422/10070 [40:35<4:06:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1422/10070 [40:35<4:06:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1423/10070 [40:37<4:06:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1423/10070 [40:37<4:06:52,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1424/10070 [40:39<4:06:54,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 1424/10070 [40:39<4:06:54,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1425/10070 [40:42<4:06:55,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  14%|▏| 1425/10070 [40:42<4:06:55,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1426/10070 [40:43<4:06:54,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  14%|▏| 1426/10070 [40:43<4:06:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1427/10070 [40:44<4:06:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1427/10070 [40:44<4:06:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1428/10070 [40:46<4:06:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1428/10070 [40:46<4:06:44,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1429/10070 [40:47<4:06:39,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 1429/10070 [40:47<4:06:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1430/10070 [40:49<4:06:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1430/10070 [40:49<4:06:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1431/10070 [40:50<4:06:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1431/10070 [40:50<4:06:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1432/10070 [40:52<4:06:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1432/10070 [40:52<4:06:35,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1433/10070 [40:54<4:06:36,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 1433/10070 [40:54<4:06:36,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1434/10070 [40:56<4:06:34,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 1434/10070 [40:56<4:06:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1435/10070 [40:58<4:06:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1435/10070 [40:58<4:06:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1436/10070 [40:59<4:06:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1436/10070 [40:59<4:06:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1437/10070 [41:00<4:06:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1437/10070 [41:00<4:06:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1438/10070 [41:01<4:06:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1438/10070 [41:01<4:06:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1439/10070 [41:02<4:06:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1439/10070 [41:02<4:06:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1440/10070 [41:11<4:06:54,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1440/10070 [41:11<4:06:54,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1441/10070 [41:12<4:06:46,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1441/10070 [41:12<4:06:46,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1442/10070 [41:13<4:06:38,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1442/10070 [41:13<4:06:38,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1443/10070 [41:15<4:06:39,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1443/10070 [41:15<4:06:39,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1444/10070 [41:17<4:06:41,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  14%|▏| 1444/10070 [41:17<4:06:41,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1445/10070 [41:18<4:06:33,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  14%|▏| 1445/10070 [41:18<4:06:33,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1446/10070 [41:19<4:06:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1446/10070 [41:19<4:06:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1447/10070 [41:19<4:06:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1447/10070 [41:19<4:06:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1448/10070 [41:21<4:06:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1448/10070 [41:21<4:06:17,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1449/10070 [41:23<4:06:15,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 1449/10070 [41:23<4:06:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1450/10070 [41:24<4:06:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1450/10070 [41:24<4:06:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1451/10070 [41:25<4:06:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1451/10070 [41:25<4:06:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1452/10070 [41:27<4:06:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1452/10070 [41:27<4:06:04,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1453/10070 [41:29<4:06:02,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  14%|▏| 1453/10070 [41:29<4:06:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1454/10070 [41:30<4:05:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1454/10070 [41:30<4:05:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1455/10070 [41:31<4:05:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1455/10070 [41:31<4:05:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1456/10070 [41:33<4:05:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1456/10070 [41:33<4:05:49,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1457/10070 [41:35<4:05:50,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 1457/10070 [41:35<4:05:50,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1458/10070 [41:35<4:05:43,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  14%|▏| 1458/10070 [41:35<4:05:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1459/10070 [41:36<4:05:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1459/10070 [41:36<4:05:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  14%|▏| 1460/10070 [41:37<4:05:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  14%|▏| 1460/10070 [41:37<4:05:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1461/10070 [41:39<4:05:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1461/10070 [41:39<4:05:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1462/10070 [41:40<4:05:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1462/10070 [41:40<4:05:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1463/10070 [41:41<4:05:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1463/10070 [41:41<4:05:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1464/10070 [41:43<4:05:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1464/10070 [41:43<4:05:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1465/10070 [41:43<4:05:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1465/10070 [41:43<4:05:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1466/10070 [41:46<4:05:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1466/10070 [41:46<4:05:08,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1467/10070 [41:47<4:05:07,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 1467/10070 [41:47<4:05:07,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1468/10070 [41:48<4:04:59,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 1468/10070 [41:48<4:04:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1469/10070 [41:49<4:04:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1469/10070 [41:49<4:04:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1470/10070 [41:51<4:04:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1470/10070 [41:51<4:04:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1471/10070 [41:52<4:04:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1471/10070 [41:52<4:04:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1472/10070 [42:04<4:05:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1472/10070 [42:04<4:05:43,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1473/10070 [42:05<4:05:38,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 1473/10070 [42:05<4:05:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1474/10070 [42:06<4:05:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1474/10070 [42:06<4:05:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1475/10070 [42:07<4:05:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1475/10070 [42:07<4:05:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1476/10070 [42:07<4:05:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1476/10070 [42:07<4:05:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1477/10070 [42:09<4:05:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1477/10070 [42:09<4:05:17,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1478/10070 [42:11<4:05:18,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 1478/10070 [42:11<4:05:18,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1479/10070 [42:12<4:05:11,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  15%|▏| 1479/10070 [42:12<4:05:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1480/10070 [42:14<4:05:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1480/10070 [42:14<4:05:12,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1481/10070 [42:16<4:05:07,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 1481/10070 [42:16<4:05:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1482/10070 [42:17<4:05:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1482/10070 [42:17<4:05:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1483/10070 [42:19<4:05:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1483/10070 [42:19<4:05:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1484/10070 [42:21<4:05:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1484/10070 [42:21<4:05:03,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1485/10070 [42:22<4:04:58,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  15%|▏| 1485/10070 [42:22<4:04:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1486/10070 [42:24<4:04:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1486/10070 [42:24<4:04:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1487/10070 [42:25<4:04:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1487/10070 [42:25<4:04:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1488/10070 [42:26<4:04:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1488/10070 [42:26<4:04:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1489/10070 [42:27<4:04:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1489/10070 [42:27<4:04:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1490/10070 [42:28<4:04:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1490/10070 [42:28<4:04:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1491/10070 [42:30<4:04:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1491/10070 [42:30<4:04:37,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1492/10070 [42:32<4:04:32,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 1492/10070 [42:32<4:04:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1493/10070 [42:34<4:04:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1493/10070 [42:34<4:04:34,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1494/10070 [42:36<4:04:35,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  15%|▏| 1494/10070 [42:36<4:04:35,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1495/10070 [42:37<4:04:31,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  15%|▏| 1495/10070 [42:37<4:04:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1496/10070 [42:39<4:04:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1496/10070 [42:39<4:04:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1497/10070 [42:39<4:04:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1497/10070 [42:39<4:04:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1498/10070 [42:41<4:04:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1498/10070 [42:41<4:04:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1499/10070 [42:42<4:04:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1499/10070 [42:42<4:04:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1500/10070 [42:44<4:04:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1500/10070 [42:44<4:04:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1501/10070 [42:46<4:04:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1501/10070 [42:46<4:04:09,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1502/10070 [42:47<4:04:05,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 1502/10070 [42:47<4:04:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1503/10070 [42:48<4:03:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1503/10070 [42:48<4:03:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1504/10070 [42:56<4:04:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1504/10070 [42:56<4:04:33,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1505/10070 [42:57<4:04:26,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  15%|▏| 1505/10070 [42:57<4:04:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1506/10070 [42:57<4:04:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1506/10070 [42:57<4:04:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1507/10070 [42:58<4:04:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1507/10070 [42:58<4:04:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1508/10070 [42:59<4:04:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1508/10070 [42:59<4:04:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1509/10070 [43:00<4:03:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1509/10070 [43:00<4:03:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1510/10070 [43:02<4:03:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1510/10070 [43:02<4:03:57,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1511/10070 [43:02<4:03:50,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 1511/10070 [43:02<4:03:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1512/10070 [43:05<4:03:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1512/10070 [43:05<4:03:51,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1513/10070 [43:06<4:03:47,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  15%|▏| 1513/10070 [43:06<4:03:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1514/10070 [43:08<4:03:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1514/10070 [43:08<4:03:48,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1515/10070 [43:10<4:03:46,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 1515/10070 [43:10<4:03:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1516/10070 [43:12<4:03:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1516/10070 [43:12<4:03:45,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1517/10070 [43:13<4:03:40,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 1517/10070 [43:13<4:03:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1518/10070 [43:15<4:03:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1518/10070 [43:15<4:03:42,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1519/10070 [43:17<4:03:40,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 1519/10070 [43:17<4:03:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1520/10070 [43:17<4:03:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1520/10070 [43:17<4:03:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1521/10070 [43:18<4:03:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1521/10070 [43:18<4:03:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1522/10070 [43:19<4:03:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1522/10070 [43:19<4:03:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1523/10070 [43:21<4:03:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1523/10070 [43:21<4:03:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1524/10070 [43:23<4:03:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1524/10070 [43:23<4:03:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1525/10070 [43:24<4:03:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1525/10070 [43:24<4:03:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1526/10070 [43:26<4:03:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1526/10070 [43:26<4:03:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1527/10070 [43:26<4:03:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1527/10070 [43:26<4:03:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1528/10070 [43:27<4:02:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1528/10070 [43:27<4:02:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1529/10070 [43:28<4:02:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1529/10070 [43:28<4:02:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1530/10070 [43:30<4:02:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1530/10070 [43:30<4:02:50,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1531/10070 [43:31<4:02:43,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 1531/10070 [43:31<4:02:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1532/10070 [43:32<4:02:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1532/10070 [43:32<4:02:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1533/10070 [43:34<4:02:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1533/10070 [43:34<4:02:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1534/10070 [43:35<4:02:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1534/10070 [43:35<4:02:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1535/10070 [43:36<4:02:28,  1.70s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1535/10070 [43:36<4:02:28,  1.70s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1536/10070 [43:53<4:03:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1536/10070 [43:53<4:03:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1537/10070 [43:55<4:03:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1537/10070 [43:55<4:03:53,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1538/10070 [43:56<4:03:46,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 1538/10070 [43:56<4:03:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1539/10070 [43:57<4:03:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1539/10070 [43:57<4:03:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1540/10070 [43:58<4:03:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1540/10070 [43:58<4:03:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1541/10070 [44:00<4:03:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1541/10070 [44:00<4:03:35,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1542/10070 [44:03<4:03:37,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 1542/10070 [44:03<4:03:37,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1543/10070 [44:04<4:03:33,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  15%|▏| 1543/10070 [44:04<4:03:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1544/10070 [44:06<4:03:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1544/10070 [44:06<4:03:31,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1545/10070 [44:07<4:03:30,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 1545/10070 [44:07<4:03:30,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1546/10070 [44:08<4:03:22,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 1546/10070 [44:08<4:03:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1547/10070 [44:10<4:03:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1547/10070 [44:10<4:03:24,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1548/10070 [44:13<4:03:25,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 1548/10070 [44:13<4:03:25,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1549/10070 [44:15<4:03:27,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  15%|▏| 1549/10070 [44:15<4:03:27,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1550/10070 [44:17<4:03:25,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  15%|▏| 1550/10070 [44:17<4:03:25,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1551/10070 [44:17<4:03:18,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 1551/10070 [44:17<4:03:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1552/10070 [44:19<4:03:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1552/10070 [44:19<4:03:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1553/10070 [44:20<4:03:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1553/10070 [44:20<4:03:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1554/10070 [44:20<4:03:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1554/10070 [44:20<4:03:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1555/10070 [44:21<4:02:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1555/10070 [44:21<4:02:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1556/10070 [44:23<4:02:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1556/10070 [44:23<4:02:53,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1557/10070 [44:24<4:02:45,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  15%|▏| 1557/10070 [44:24<4:02:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1558/10070 [44:25<4:02:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1558/10070 [44:25<4:02:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1559/10070 [44:26<4:02:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1559/10070 [44:26<4:02:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  15%|▏| 1560/10070 [44:27<4:02:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  15%|▏| 1560/10070 [44:27<4:02:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1561/10070 [44:27<4:02:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1561/10070 [44:27<4:02:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1562/10070 [44:29<4:02:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1562/10070 [44:29<4:02:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1563/10070 [44:30<4:02:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1563/10070 [44:30<4:02:16,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1564/10070 [44:32<4:02:14,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 1564/10070 [44:32<4:02:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1565/10070 [44:34<4:02:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1565/10070 [44:34<4:02:13,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1566/10070 [44:36<4:02:14,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 1566/10070 [44:36<4:02:14,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1567/10070 [44:37<4:02:09,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 1567/10070 [44:37<4:02:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1568/10070 [44:47<4:02:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1568/10070 [44:47<4:02:49,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1569/10070 [44:49<4:02:50,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 1569/10070 [44:49<4:02:50,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1570/10070 [44:50<4:02:48,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  16%|▏| 1570/10070 [44:50<4:02:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1571/10070 [44:52<4:02:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1571/10070 [44:52<4:02:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1572/10070 [44:54<4:02:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1572/10070 [44:54<4:02:45,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1573/10070 [44:54<4:02:37,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 1573/10070 [44:54<4:02:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1574/10070 [44:56<4:02:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1574/10070 [44:56<4:02:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1575/10070 [44:57<4:02:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1575/10070 [44:57<4:02:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1576/10070 [45:00<4:02:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1576/10070 [45:00<4:02:32,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1577/10070 [45:02<4:02:32,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  16%|▏| 1577/10070 [45:02<4:02:32,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1578/10070 [45:04<4:02:33,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  16%|▏| 1578/10070 [45:04<4:02:33,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1579/10070 [45:05<4:02:26,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  16%|▏| 1579/10070 [45:05<4:02:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1580/10070 [45:07<4:02:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1580/10070 [45:07<4:02:27,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1581/10070 [45:08<4:02:20,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  16%|▏| 1581/10070 [45:08<4:02:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1582/10070 [45:10<4:02:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1582/10070 [45:10<4:02:21,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1583/10070 [45:10<4:02:14,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  16%|▏| 1583/10070 [45:10<4:02:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1584/10070 [45:12<4:02:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1584/10070 [45:12<4:02:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1585/10070 [45:14<4:02:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1585/10070 [45:14<4:02:12,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1586/10070 [45:16<4:02:13,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 1586/10070 [45:16<4:02:13,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1587/10070 [45:18<4:02:11,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  16%|▏| 1587/10070 [45:18<4:02:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1588/10070 [45:20<4:02:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1588/10070 [45:20<4:02:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1589/10070 [45:21<4:02:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1589/10070 [45:21<4:02:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1590/10070 [45:23<4:02:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1590/10070 [45:23<4:02:04,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1591/10070 [45:25<4:02:02,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  16%|▏| 1591/10070 [45:25<4:02:02,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1592/10070 [45:26<4:01:58,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 1592/10070 [45:26<4:01:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1593/10070 [45:28<4:01:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1593/10070 [45:28<4:01:59,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1594/10070 [45:29<4:01:55,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1594/10070 [45:29<4:01:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1595/10070 [45:30<4:01:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1595/10070 [45:30<4:01:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1596/10070 [45:31<4:01:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1596/10070 [45:31<4:01:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1597/10070 [45:31<4:01:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1597/10070 [45:31<4:01:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1598/10070 [45:34<4:01:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1598/10070 [45:34<4:01:34,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1599/10070 [45:36<4:01:36,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  16%|▏| 1599/10070 [45:36<4:01:36,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1600/10070 [45:42<4:01:59,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  16%|▏| 1600/10070 [45:42<4:01:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1601/10070 [46:04<4:03:41,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1601/10070 [46:04<4:03:41,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1602/10070 [46:05<4:03:36,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1602/10070 [46:05<4:03:36,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1603/10070 [46:07<4:03:35,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1603/10070 [46:07<4:03:35,  1.73s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1604/10070 [46:08<4:03:33,  1.73s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 1604/10070 [46:08<4:03:33,  1.73s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1605/10070 [46:11<4:03:34,  1.73s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 1605/10070 [46:11<4:03:34,  1.73s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1606/10070 [46:13<4:03:36,  1.73s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  16%|▏| 1606/10070 [46:13<4:03:36,  1.73s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1607/10070 [46:15<4:03:37,  1.73s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  16%|▏| 1607/10070 [46:15<4:03:37,  1.73s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1608/10070 [46:16<4:03:33,  1.73s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 1608/10070 [46:16<4:03:33,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1609/10070 [46:19<4:03:34,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1609/10070 [46:19<4:03:34,  1.73s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1610/10070 [46:20<4:03:29,  1.73s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 1610/10070 [46:20<4:03:29,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1611/10070 [46:22<4:03:31,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1611/10070 [46:22<4:03:31,  1.73s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1612/10070 [46:23<4:03:26,  1.73s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 1612/10070 [46:23<4:03:26,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1613/10070 [46:24<4:03:19,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1613/10070 [46:24<4:03:19,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1614/10070 [46:25<4:03:12,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1614/10070 [46:25<4:03:12,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1615/10070 [46:27<4:03:11,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1615/10070 [46:27<4:03:11,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1616/10070 [46:29<4:03:11,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1616/10070 [46:29<4:03:11,  1.73s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1617/10070 [46:30<4:03:07,  1.73s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  16%|���| 1617/10070 [46:30<4:03:07,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1618/10070 [46:32<4:03:05,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1618/10070 [46:32<4:03:05,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1619/10070 [46:34<4:03:06,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1619/10070 [46:34<4:03:06,  1.73s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1620/10070 [46:35<4:02:59,  1.73s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  16%|▏| 1620/10070 [46:35<4:02:59,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1621/10070 [46:37<4:03:00,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1621/10070 [46:37<4:03:00,  1.73s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1622/10070 [46:39<4:03:01,  1.73s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  16%|▏| 1622/10070 [46:39<4:03:01,  1.73s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1623/10070 [46:41<4:03:00,  1.73s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  16%|▏| 1623/10070 [46:41<4:03:00,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1624/10070 [46:42<4:02:56,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1624/10070 [46:42<4:02:56,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1625/10070 [46:43<4:02:49,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1625/10070 [46:43<4:02:49,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1626/10070 [46:44<4:02:44,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1626/10070 [46:44<4:02:44,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1627/10070 [46:45<4:02:37,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1627/10070 [46:45<4:02:37,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1628/10070 [46:45<4:02:30,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1628/10070 [46:45<4:02:30,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1629/10070 [46:48<4:02:31,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1629/10070 [46:48<4:02:31,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1630/10070 [46:49<4:02:27,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  16%|▏| 1630/10070 [46:49<4:02:27,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1631/10070 [46:50<4:02:22,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1631/10070 [46:50<4:02:22,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1632/10070 [46:58<4:02:51,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1632/10070 [46:58<4:02:51,  1.73s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1633/10070 [46:58<4:02:43,  1.73s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 1633/10070 [46:58<4:02:43,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1634/10070 [47:00<4:02:39,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1634/10070 [47:00<4:02:39,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1635/10070 [47:00<4:02:32,  1.73s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1635/10070 [47:00<4:02:32,  1.73s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1636/10070 [47:01<4:02:24,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1636/10070 [47:01<4:02:24,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1637/10070 [47:02<4:02:17,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1637/10070 [47:02<4:02:17,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1638/10070 [47:02<4:02:10,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1638/10070 [47:02<4:02:10,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1639/10070 [47:03<4:02:06,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1639/10070 [47:03<4:02:06,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1640/10070 [47:06<4:02:07,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1640/10070 [47:06<4:02:07,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1641/10070 [47:08<4:02:08,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 1641/10070 [47:08<4:02:08,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1642/10070 [47:09<4:02:01,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 1642/10070 [47:09<4:02:01,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1643/10070 [47:10<4:01:59,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1643/10070 [47:10<4:01:59,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1644/10070 [47:12<4:01:54,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1644/10070 [47:12<4:01:54,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1645/10070 [47:12<4:01:47,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1645/10070 [47:12<4:01:47,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1646/10070 [47:14<4:01:46,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1646/10070 [47:14<4:01:46,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1647/10070 [47:16<4:01:44,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1647/10070 [47:16<4:01:44,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1648/10070 [47:16<4:01:37,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1648/10070 [47:16<4:01:37,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1649/10070 [47:18<4:01:32,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1649/10070 [47:18<4:01:32,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1650/10070 [47:20<4:01:33,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1650/10070 [47:20<4:01:33,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1651/10070 [47:20<4:01:26,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 1651/10070 [47:20<4:01:26,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1652/10070 [47:21<4:01:19,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1652/10070 [47:21<4:01:19,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1653/10070 [47:22<4:01:12,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1653/10070 [47:22<4:01:12,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1654/10070 [47:22<4:01:05,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1654/10070 [47:22<4:01:05,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1655/10070 [47:23<4:00:58,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1655/10070 [47:23<4:00:58,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1656/10070 [47:24<4:00:54,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1656/10070 [47:24<4:00:54,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1657/10070 [47:26<4:00:52,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1657/10070 [47:26<4:00:52,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1658/10070 [47:27<4:00:48,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 1658/10070 [47:27<4:00:48,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1659/10070 [47:28<4:00:41,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1659/10070 [47:28<4:00:41,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1660/10070 [47:30<4:00:39,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  16%|▏| 1660/10070 [47:30<4:00:39,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  16%|▏| 1661/10070 [47:30<4:00:32,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  16%|▏| 1661/10070 [47:30<4:00:32,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1662/10070 [47:32<4:00:28,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1662/10070 [47:32<4:00:28,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1663/10070 [47:34<4:00:29,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1663/10070 [47:34<4:00:29,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1664/10070 [47:49<4:01:38,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  17%|▏| 1664/10070 [47:49<4:01:38,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1665/10070 [47:50<4:01:30,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1665/10070 [47:50<4:01:30,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1666/10070 [47:51<4:01:26,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1666/10070 [47:51<4:01:26,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1667/10070 [47:54<4:01:27,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1667/10070 [47:54<4:01:27,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1668/10070 [47:55<4:01:26,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  17%|▏| 1668/10070 [47:55<4:01:26,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1669/10070 [47:57<4:01:24,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1669/10070 [47:57<4:01:24,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1670/10070 [47:59<4:01:22,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1670/10070 [47:59<4:01:22,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1671/10070 [48:01<4:01:23,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1671/10070 [48:01<4:01:23,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1672/10070 [48:02<4:01:16,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 1672/10070 [48:02<4:01:16,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1673/10070 [48:02<4:01:09,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1673/10070 [48:02<4:01:09,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1674/10070 [48:04<4:01:07,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1674/10070 [48:04<4:01:07,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1675/10070 [48:05<4:01:00,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1675/10070 [48:05<4:01:00,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1676/10070 [48:06<4:00:55,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1676/10070 [48:06<4:00:55,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1677/10070 [48:07<4:00:49,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1677/10070 [48:07<4:00:49,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1678/10070 [48:09<4:00:50,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1678/10070 [48:09<4:00:50,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1679/10070 [48:10<4:00:43,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  17%|▏| 1679/10070 [48:10<4:00:43,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1680/10070 [48:11<4:00:41,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1680/10070 [48:11<4:00:41,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1681/10070 [48:13<4:00:40,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 1681/10070 [48:13<4:00:40,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1682/10070 [48:15<4:00:38,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 1682/10070 [48:15<4:00:38,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1683/10070 [48:15<4:00:31,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1683/10070 [48:15<4:00:31,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1684/10070 [48:16<4:00:24,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1684/10070 [48:16<4:00:24,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1685/10070 [48:17<4:00:18,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1685/10070 [48:17<4:00:18,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1686/10070 [48:19<4:00:16,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1686/10070 [48:19<4:00:16,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1687/10070 [48:19<4:00:09,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 1687/10070 [48:19<4:00:09,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1688/10070 [48:20<4:00:02,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1688/10070 [48:20<4:00:02,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1689/10070 [48:21<3:59:58,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1689/10070 [48:21<3:59:58,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1690/10070 [48:22<3:59:54,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1690/10070 [48:22<3:59:54,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1691/10070 [48:24<3:59:52,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1691/10070 [48:24<3:59:52,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1692/10070 [48:25<3:59:46,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 1692/10070 [48:25<3:59:46,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1693/10070 [48:26<3:59:39,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1693/10070 [48:26<3:59:39,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1694/10070 [48:27<3:59:35,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1694/10070 [48:27<3:59:35,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1695/10070 [48:28<3:59:30,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1695/10070 [48:28<3:59:30,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1696/10070 [48:44<4:00:40,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1696/10070 [48:44<4:00:40,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1697/10070 [48:45<4:00:33,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 1697/10070 [48:45<4:00:33,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1698/10070 [48:46<4:00:29,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1698/10070 [48:46<4:00:29,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1699/10070 [48:47<4:00:25,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1699/10070 [48:47<4:00:25,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1700/10070 [48:50<4:00:26,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1700/10070 [48:50<4:00:26,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1701/10070 [48:50<4:00:19,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 1701/10070 [48:50<4:00:19,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1702/10070 [48:52<4:00:20,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1702/10070 [48:52<4:00:20,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1703/10070 [48:53<4:00:13,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 1703/10070 [48:53<4:00:13,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1704/10070 [48:55<4:00:13,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1704/10070 [48:55<4:00:13,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1705/10070 [48:57<4:00:12,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 1705/10070 [48:57<4:00:12,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1706/10070 [48:58<4:00:05,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1706/10070 [48:58<4:00:05,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1707/10070 [48:59<4:00:03,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1707/10070 [48:59<4:00:03,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1708/10070 [49:02<4:00:04,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 1708/10070 [49:02<4:00:04,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1709/10070 [49:03<4:00:00,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 1709/10070 [49:03<4:00:00,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1710/10070 [49:05<4:00:01,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1710/10070 [49:05<4:00:01,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1711/10070 [49:07<3:59:59,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  17%|▏| 1711/10070 [49:07<3:59:59,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1712/10070 [49:09<3:59:57,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1712/10070 [49:09<3:59:57,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1713/10070 [49:11<3:59:58,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1713/10070 [49:11<3:59:58,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1714/10070 [49:13<3:59:56,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 1714/10070 [49:13<3:59:56,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1715/10070 [49:14<3:59:54,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 1715/10070 [49:14<3:59:54,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1716/10070 [49:16<3:59:53,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1716/10070 [49:16<3:59:53,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1717/10070 [49:17<3:59:46,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 1717/10070 [49:17<3:59:46,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1718/10070 [49:18<3:59:44,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1718/10070 [49:18<3:59:44,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1719/10070 [49:20<3:59:40,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1719/10070 [49:20<3:59:40,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1720/10070 [49:21<3:59:36,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1720/10070 [49:21<3:59:36,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1721/10070 [49:22<3:59:32,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1721/10070 [49:22<3:59:32,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1722/10070 [49:24<3:59:30,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1722/10070 [49:24<3:59:30,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1723/10070 [49:24<3:59:23,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1723/10070 [49:24<3:59:23,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1724/10070 [49:27<3:59:24,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1724/10070 [49:27<3:59:24,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1725/10070 [49:28<3:59:22,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  17%|▏| 1725/10070 [49:28<3:59:22,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1726/10070 [49:29<3:59:15,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1726/10070 [49:29<3:59:15,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1727/10070 [49:31<3:59:16,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1727/10070 [49:31<3:59:16,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1728/10070 [49:38<3:59:39,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 1728/10070 [49:38<3:59:39,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1729/10070 [49:40<3:59:38,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1729/10070 [49:40<3:59:38,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1730/10070 [49:42<3:59:39,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1730/10070 [49:42<3:59:39,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1731/10070 [49:44<3:59:37,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 1731/10070 [49:44<3:59:37,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1732/10070 [49:46<3:59:35,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1732/10070 [49:46<3:59:35,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1733/10070 [49:46<3:59:29,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1733/10070 [49:46<3:59:29,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1734/10070 [49:48<3:59:27,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1734/10070 [49:48<3:59:27,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1735/10070 [49:50<3:59:25,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1735/10070 [49:50<3:59:25,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1736/10070 [49:52<3:59:26,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1736/10070 [49:52<3:59:26,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1737/10070 [49:53<3:59:22,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  17%|▏| 1737/10070 [49:53<3:59:22,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1738/10070 [49:55<3:59:20,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1738/10070 [49:55<3:59:20,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1739/10070 [49:56<3:59:13,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1739/10070 [49:56<3:59:13,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1740/10070 [49:56<3:59:06,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1740/10070 [49:56<3:59:06,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1741/10070 [49:57<3:59:00,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1741/10070 [49:57<3:59:00,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1742/10070 [49:59<3:58:58,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1742/10070 [49:59<3:58:58,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1743/10070 [50:01<3:58:59,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1743/10070 [50:01<3:58:59,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1744/10070 [50:03<3:58:57,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 1744/10070 [50:03<3:58:57,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1745/10070 [50:04<3:58:53,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1745/10070 [50:04<3:58:53,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1746/10070 [50:05<3:58:47,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1746/10070 [50:05<3:58:47,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1747/10070 [50:05<3:58:40,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1747/10070 [50:05<3:58:40,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1748/10070 [50:08<3:58:41,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1748/10070 [50:08<3:58:41,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1749/10070 [50:08<3:58:34,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 1749/10070 [50:08<3:58:34,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1750/10070 [50:11<3:58:35,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1750/10070 [50:11<3:58:35,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1751/10070 [50:13<3:58:36,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  17%|▏| 1751/10070 [50:13<3:58:36,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1752/10070 [50:15<3:58:37,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  17%|▏| 1752/10070 [50:15<3:58:37,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1753/10070 [50:17<3:58:38,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 1753/10070 [50:17<3:58:38,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1754/10070 [50:19<3:58:36,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  17%|▏| 1754/10070 [50:19<3:58:36,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1755/10070 [50:21<3:58:34,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1755/10070 [50:21<3:58:34,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1756/10070 [50:22<3:58:30,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1756/10070 [50:22<3:58:30,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1757/10070 [50:24<3:58:31,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1757/10070 [50:24<3:58:31,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1758/10070 [50:26<3:58:29,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  17%|▏| 1758/10070 [50:26<3:58:29,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1759/10070 [50:27<3:58:23,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1759/10070 [50:27<3:58:23,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1760/10070 [50:35<3:58:51,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1760/10070 [50:35<3:58:51,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1761/10070 [50:35<3:58:44,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  17%|▏| 1761/10070 [50:35<3:58:44,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  17%|▏| 1762/10070 [50:37<3:58:40,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  17%|▏| 1762/10070 [50:37<3:58:40,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1763/10070 [50:38<3:58:36,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1763/10070 [50:38<3:58:36,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1764/10070 [50:39<3:58:29,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1764/10070 [50:39<3:58:29,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1765/10070 [50:40<3:58:28,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1765/10070 [50:40<3:58:28,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1766/10070 [50:42<3:58:26,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1766/10070 [50:42<3:58:26,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1767/10070 [50:44<3:58:27,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1767/10070 [50:44<3:58:27,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1768/10070 [50:45<3:58:20,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  18%|▏| 1768/10070 [50:45<3:58:20,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1769/10070 [50:46<3:58:13,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1769/10070 [50:46<3:58:13,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1770/10070 [50:47<3:58:09,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1770/10070 [50:47<3:58:09,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1771/10070 [50:48<3:58:05,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1771/10070 [50:48<3:58:05,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1772/10070 [50:50<3:58:04,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1772/10070 [50:50<3:58:04,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1773/10070 [50:50<3:57:57,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1773/10070 [50:50<3:57:57,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1774/10070 [50:51<3:57:50,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1774/10070 [50:51<3:57:50,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1775/10070 [50:53<3:57:51,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1775/10070 [50:53<3:57:51,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1776/10070 [50:55<3:57:50,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1776/10070 [50:55<3:57:50,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1777/10070 [50:57<3:57:50,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1777/10070 [50:57<3:57:50,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1778/10070 [50:59<3:57:50,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1778/10070 [50:59<3:57:50,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1779/10070 [51:02<3:57:51,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1779/10070 [51:02<3:57:51,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1780/10070 [51:03<3:57:47,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1780/10070 [51:03<3:57:47,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1781/10070 [51:05<3:57:48,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1781/10070 [51:05<3:57:48,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1782/10070 [51:07<3:57:46,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1782/10070 [51:07<3:57:46,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1783/10070 [51:09<3:57:47,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1783/10070 [51:09<3:57:47,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1784/10070 [51:12<3:57:48,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1784/10070 [51:12<3:57:48,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1785/10070 [51:13<3:57:44,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1785/10070 [51:13<3:57:44,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1786/10070 [51:14<3:57:42,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1786/10070 [51:14<3:57:42,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1787/10070 [51:15<3:57:35,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1787/10070 [51:15<3:57:35,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1788/10070 [51:16<3:57:29,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1788/10070 [51:16<3:57:29,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1789/10070 [51:18<3:57:27,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1789/10070 [51:18<3:57:27,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1790/10070 [51:20<3:57:28,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1790/10070 [51:20<3:57:28,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1791/10070 [51:22<3:57:27,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  18%|▏| 1791/10070 [51:22<3:57:27,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1792/10070 [51:28<3:57:48,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1792/10070 [51:28<3:57:48,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1793/10070 [51:30<3:57:46,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1793/10070 [51:30<3:57:46,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1794/10070 [51:31<3:57:40,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1794/10070 [51:31<3:57:40,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1795/10070 [51:32<3:57:36,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1795/10070 [51:32<3:57:36,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1796/10070 [51:33<3:57:32,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1796/10070 [51:33<3:57:32,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1797/10070 [51:34<3:57:28,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1797/10070 [51:34<3:57:28,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1798/10070 [51:36<3:57:24,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1798/10070 [51:36<3:57:24,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1799/10070 [51:38<3:57:24,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1799/10070 [51:38<3:57:24,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1800/10070 [51:39<3:57:20,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1800/10070 [51:39<3:57:20,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1801/10070 [51:41<3:57:21,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1801/10070 [51:41<3:57:21,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1802/10070 [51:42<3:57:15,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1802/10070 [51:42<3:57:15,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1803/10070 [51:43<3:57:08,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1803/10070 [51:43<3:57:08,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1804/10070 [51:44<3:57:07,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1804/10070 [51:44<3:57:07,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1805/10070 [51:46<3:57:05,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1805/10070 [51:46<3:57:05,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1806/10070 [51:47<3:57:01,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1806/10070 [51:47<3:57:01,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1807/10070 [51:49<3:56:57,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1807/10070 [51:49<3:56:57,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1808/10070 [51:50<3:56:53,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1808/10070 [51:50<3:56:53,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1809/10070 [51:51<3:56:46,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1809/10070 [51:51<3:56:46,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1810/10070 [51:53<3:56:47,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1810/10070 [51:53<3:56:47,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1811/10070 [51:53<3:56:41,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1811/10070 [51:53<3:56:41,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1812/10070 [51:56<3:56:42,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1812/10070 [51:56<3:56:42,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1813/10070 [51:56<3:56:35,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1813/10070 [51:56<3:56:35,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1814/10070 [51:58<3:56:31,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1814/10070 [51:58<3:56:31,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1815/10070 [51:59<3:56:27,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1815/10070 [51:59<3:56:27,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1816/10070 [52:01<3:56:25,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1816/10070 [52:01<3:56:25,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1817/10070 [52:02<3:56:24,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1817/10070 [52:02<3:56:24,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1818/10070 [52:04<3:56:22,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1818/10070 [52:04<3:56:22,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1819/10070 [52:06<3:56:23,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1819/10070 [52:06<3:56:23,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1820/10070 [52:08<3:56:19,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  18%|▏| 1820/10070 [52:08<3:56:19,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1821/10070 [52:09<3:56:17,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1821/10070 [52:09<3:56:17,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1822/10070 [52:12<3:56:18,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1822/10070 [52:12<3:56:18,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1823/10070 [52:13<3:56:16,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1823/10070 [52:13<3:56:16,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1824/10070 [52:22<3:56:48,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1824/10070 [52:22<3:56:48,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1825/10070 [52:23<3:56:41,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1825/10070 [52:23<3:56:41,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1826/10070 [52:25<3:56:39,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1826/10070 [52:25<3:56:39,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1827/10070 [52:26<3:56:38,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1827/10070 [52:26<3:56:38,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1828/10070 [52:28<3:56:33,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1828/10070 [52:28<3:56:33,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1829/10070 [52:30<3:56:34,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1829/10070 [52:30<3:56:34,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1830/10070 [52:32<3:56:33,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  18%|▏| 1830/10070 [52:32<3:56:33,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1831/10070 [52:32<3:56:26,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1831/10070 [52:32<3:56:26,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1832/10070 [52:35<3:56:27,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1832/10070 [52:35<3:56:27,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1833/10070 [52:36<3:56:25,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  18%|▏| 1833/10070 [52:36<3:56:25,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1834/10070 [52:37<3:56:19,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1834/10070 [52:37<3:56:19,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1835/10070 [52:38<3:56:12,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1835/10070 [52:38<3:56:12,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1836/10070 [52:39<3:56:10,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1836/10070 [52:39<3:56:10,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1837/10070 [52:41<3:56:09,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1837/10070 [52:41<3:56:09,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1838/10070 [52:42<3:56:05,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1838/10070 [52:42<3:56:05,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1839/10070 [52:43<3:55:59,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1839/10070 [52:43<3:55:59,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1840/10070 [52:44<3:55:52,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1840/10070 [52:44<3:55:52,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1841/10070 [52:45<3:55:50,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1841/10070 [52:45<3:55:50,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1842/10070 [52:48<3:55:51,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1842/10070 [52:48<3:55:51,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1843/10070 [52:49<3:55:49,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1843/10070 [52:49<3:55:49,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1844/10070 [52:52<3:55:50,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1844/10070 [52:52<3:55:50,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1845/10070 [52:53<3:55:48,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1845/10070 [52:53<3:55:48,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1846/10070 [52:54<3:55:42,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1846/10070 [52:54<3:55:42,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1847/10070 [52:55<3:55:35,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1847/10070 [52:55<3:55:35,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1848/10070 [52:56<3:55:31,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1848/10070 [52:56<3:55:31,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1849/10070 [52:57<3:55:27,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1849/10070 [52:57<3:55:27,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1850/10070 [52:58<3:55:23,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1850/10070 [52:58<3:55:23,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1851/10070 [52:59<3:55:19,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1851/10070 [52:59<3:55:19,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1852/10070 [53:01<3:55:19,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1852/10070 [53:01<3:55:19,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1853/10070 [53:02<3:55:13,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  18%|▏| 1853/10070 [53:02<3:55:13,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1854/10070 [53:04<3:55:13,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1854/10070 [53:04<3:55:13,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1855/10070 [53:06<3:55:09,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  18%|▏| 1855/10070 [53:06<3:55:09,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1856/10070 [53:15<3:55:40,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1856/10070 [53:15<3:55:40,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1857/10070 [53:15<3:55:33,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1857/10070 [53:15<3:55:33,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1858/10070 [53:17<3:55:32,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1858/10070 [53:17<3:55:32,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1859/10070 [53:18<3:55:28,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1859/10070 [53:18<3:55:28,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1860/10070 [53:20<3:55:28,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1860/10070 [53:20<3:55:28,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1861/10070 [53:22<3:55:26,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  18%|▏| 1861/10070 [53:22<3:55:26,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  18%|▏| 1862/10070 [53:23<3:55:22,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  18%|▏| 1862/10070 [53:23<3:55:22,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1863/10070 [53:25<3:55:22,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1863/10070 [53:25<3:55:22,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1864/10070 [53:27<3:55:18,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  19%|▏| 1864/10070 [53:27<3:55:18,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1865/10070 [53:27<3:55:12,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1865/10070 [53:27<3:55:12,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1866/10070 [53:29<3:55:12,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1866/10070 [53:29<3:55:12,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1867/10070 [53:31<3:55:11,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  19%|▏| 1867/10070 [53:31<3:55:11,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1868/10070 [53:32<3:55:04,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1868/10070 [53:32<3:55:04,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1869/10070 [53:34<3:55:05,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1869/10070 [53:34<3:55:05,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1870/10070 [53:35<3:55:01,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  19%|▏| 1870/10070 [53:35<3:55:01,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1871/10070 [53:36<3:54:55,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1871/10070 [53:36<3:54:55,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1872/10070 [53:37<3:54:50,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1872/10070 [53:37<3:54:50,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1873/10070 [53:39<3:54:49,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1873/10070 [53:39<3:54:49,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1874/10070 [53:41<3:54:49,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  19%|▏| 1874/10070 [53:41<3:54:49,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1875/10070 [53:43<3:54:47,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  19%|▏| 1875/10070 [53:43<3:54:47,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1876/10070 [53:44<3:54:43,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1876/10070 [53:44<3:54:43,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1877/10070 [53:45<3:54:39,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1877/10070 [53:45<3:54:39,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1878/10070 [53:46<3:54:33,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1878/10070 [53:46<3:54:33,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1879/10070 [53:47<3:54:31,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1879/10070 [53:47<3:54:31,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1880/10070 [53:48<3:54:25,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1880/10070 [53:48<3:54:25,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1881/10070 [53:50<3:54:23,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1881/10070 [53:50<3:54:23,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1882/10070 [53:51<3:54:19,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1882/10070 [53:51<3:54:19,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1883/10070 [53:53<3:54:17,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1883/10070 [53:53<3:54:17,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1884/10070 [53:55<3:54:17,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1884/10070 [53:55<3:54:17,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1885/10070 [53:56<3:54:11,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  19%|▏| 1885/10070 [53:56<3:54:11,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1886/10070 [53:58<3:54:11,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1886/10070 [53:58<3:54:11,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1887/10070 [53:59<3:54:07,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1887/10070 [53:59<3:54:07,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1888/10070 [54:08<3:54:38,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1888/10070 [54:08<3:54:38,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1889/10070 [54:10<3:54:39,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1889/10070 [54:10<3:54:39,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1890/10070 [54:11<3:54:32,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  19%|▏| 1890/10070 [54:11<3:54:32,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1891/10070 [54:13<3:54:30,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1891/10070 [54:13<3:54:30,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1892/10070 [54:13<3:54:24,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1892/10070 [54:13<3:54:24,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1893/10070 [54:14<3:54:18,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1893/10070 [54:14<3:54:18,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1894/10070 [54:15<3:54:14,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1894/10070 [54:15<3:54:14,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1895/10070 [54:17<3:54:12,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1895/10070 [54:17<3:54:12,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1896/10070 [54:19<3:54:10,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1896/10070 [54:19<3:54:10,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1897/10070 [54:19<3:54:04,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  19%|▏| 1897/10070 [54:19<3:54:04,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1898/10070 [54:22<3:54:05,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1898/10070 [54:22<3:54:05,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1899/10070 [54:22<3:53:58,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  19%|▏| 1899/10070 [54:22<3:53:58,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1900/10070 [54:23<3:53:52,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1900/10070 [54:23<3:53:52,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1901/10070 [54:25<3:53:51,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1901/10070 [54:25<3:53:51,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1902/10070 [54:25<3:53:44,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1902/10070 [54:25<3:53:44,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1903/10070 [54:26<3:53:38,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1903/10070 [54:26<3:53:38,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1904/10070 [54:28<3:53:37,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1904/10070 [54:28<3:53:37,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1905/10070 [54:29<3:53:33,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1905/10070 [54:29<3:53:33,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1906/10070 [54:30<3:53:27,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1906/10070 [54:30<3:53:27,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1907/10070 [54:31<3:53:25,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1907/10070 [54:31<3:53:25,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1908/10070 [54:34<3:53:25,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1908/10070 [54:34<3:53:25,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1909/10070 [54:35<3:53:24,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  19%|▏| 1909/10070 [54:35<3:53:24,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1910/10070 [54:37<3:53:22,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1910/10070 [54:37<3:53:22,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1911/10070 [54:39<3:53:23,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1911/10070 [54:39<3:53:23,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1912/10070 [54:40<3:53:17,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  19%|▏| 1912/10070 [54:40<3:53:17,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1913/10070 [54:41<3:53:10,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1913/10070 [54:41<3:53:10,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1914/10070 [54:41<3:53:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1914/10070 [54:41<3:53:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1915/10070 [54:42<3:52:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1915/10070 [54:42<3:52:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1916/10070 [54:43<3:52:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1916/10070 [54:43<3:52:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1917/10070 [54:44<3:52:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1917/10070 [54:44<3:52:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1918/10070 [54:46<3:52:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1918/10070 [54:46<3:52:49,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1919/10070 [54:47<3:52:45,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  19%|▏| 1919/10070 [54:47<3:52:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1920/10070 [55:02<3:53:37,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1920/10070 [55:02<3:53:37,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1921/10070 [55:02<3:53:31,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1921/10070 [55:02<3:53:31,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1922/10070 [55:04<3:53:29,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1922/10070 [55:04<3:53:29,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1923/10070 [55:05<3:53:23,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1923/10070 [55:05<3:53:23,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1924/10070 [55:06<3:53:19,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1924/10070 [55:06<3:53:19,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1925/10070 [55:08<3:53:19,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1925/10070 [55:08<3:53:19,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1926/10070 [55:10<3:53:17,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  19%|▏| 1926/10070 [55:10<3:53:17,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1927/10070 [55:11<3:53:11,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  19%|▏| 1927/10070 [55:11<3:53:11,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1928/10070 [55:12<3:53:09,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1928/10070 [55:12<3:53:09,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1929/10070 [55:14<3:53:07,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1929/10070 [55:14<3:53:07,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1930/10070 [55:15<3:53:03,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1930/10070 [55:15<3:53:03,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1931/10070 [55:16<3:52:59,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1931/10070 [55:16<3:52:59,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1932/10070 [55:17<3:52:53,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1932/10070 [55:17<3:52:53,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1933/10070 [55:18<3:52:49,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1933/10070 [55:18<3:52:49,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1934/10070 [55:19<3:52:45,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1934/10070 [55:19<3:52:45,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1935/10070 [55:21<3:52:45,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1935/10070 [55:21<3:52:45,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1936/10070 [55:22<3:52:39,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  19%|▏| 1936/10070 [55:22<3:52:39,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1937/10070 [55:23<3:52:33,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1937/10070 [55:23<3:52:33,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1938/10070 [55:23<3:52:27,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1938/10070 [55:23<3:52:27,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1939/10070 [55:25<3:52:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1939/10070 [55:25<3:52:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1940/10070 [55:27<3:52:23,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1940/10070 [55:27<3:52:23,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1941/10070 [55:29<3:52:22,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  19%|▏| 1941/10070 [55:29<3:52:22,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1942/10070 [55:30<3:52:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1942/10070 [55:30<3:52:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1943/10070 [55:31<3:52:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1943/10070 [55:31<3:52:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1944/10070 [55:32<3:52:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1944/10070 [55:32<3:52:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1945/10070 [55:34<3:52:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1945/10070 [55:34<3:52:08,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1946/10070 [55:35<3:52:05,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1946/10070 [55:35<3:52:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1947/10070 [55:36<3:51:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1947/10070 [55:36<3:51:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1948/10070 [55:38<3:51:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1948/10070 [55:38<3:51:59,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1949/10070 [55:39<3:51:53,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  19%|▏| 1949/10070 [55:39<3:51:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1950/10070 [55:40<3:51:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1950/10070 [55:40<3:51:51,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1951/10070 [55:41<3:51:45,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  19%|▏| 1951/10070 [55:41<3:51:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1952/10070 [55:55<3:52:35,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1952/10070 [55:55<3:52:35,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1953/10070 [55:56<3:52:29,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1953/10070 [55:56<3:52:29,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1954/10070 [55:57<3:52:23,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1954/10070 [55:57<3:52:23,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1955/10070 [55:57<3:52:18,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1955/10070 [55:57<3:52:18,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1956/10070 [55:58<3:52:12,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1956/10070 [55:58<3:52:12,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1957/10070 [55:59<3:52:07,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1957/10070 [55:59<3:52:07,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1958/10070 [56:01<3:52:05,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1958/10070 [56:01<3:52:05,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1959/10070 [56:02<3:52:04,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1959/10070 [56:02<3:52:04,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1960/10070 [56:03<3:51:58,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1960/10070 [56:03<3:51:58,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1961/10070 [56:05<3:51:58,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1961/10070 [56:05<3:51:58,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1962/10070 [56:06<3:51:52,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  19%|▏| 1962/10070 [56:06<3:51:52,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  19%|▏| 1963/10070 [56:08<3:51:53,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  19%|▏| 1963/10070 [56:08<3:51:53,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1964/10070 [56:11<3:51:54,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 1964/10070 [56:11<3:51:54,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1965/10070 [56:12<3:51:50,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 1965/10070 [56:12<3:51:50,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1966/10070 [56:13<3:51:46,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1966/10070 [56:13<3:51:46,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1967/10070 [56:15<3:51:44,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1967/10070 [56:15<3:51:44,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1968/10070 [56:17<3:51:45,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1968/10070 [56:17<3:51:45,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1969/10070 [56:18<3:51:39,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 1969/10070 [56:18<3:51:39,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1970/10070 [56:20<3:51:40,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1970/10070 [56:20<3:51:40,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1971/10070 [56:21<3:51:36,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1971/10070 [56:21<3:51:36,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1972/10070 [56:24<3:51:36,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1972/10070 [56:24<3:51:36,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1973/10070 [56:25<3:51:33,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 1973/10070 [56:25<3:51:33,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1974/10070 [56:26<3:51:29,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1974/10070 [56:26<3:51:29,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1975/10070 [56:27<3:51:23,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1975/10070 [56:27<3:51:23,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1976/10070 [56:29<3:51:22,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1976/10070 [56:29<3:51:22,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1977/10070 [56:29<3:51:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1977/10070 [56:29<3:51:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1978/10070 [56:32<3:51:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1978/10070 [56:32<3:51:16,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1979/10070 [56:33<3:51:15,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 1979/10070 [56:33<3:51:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1980/10070 [56:36<3:51:15,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1980/10070 [56:36<3:51:15,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1981/10070 [56:37<3:51:14,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 1981/10070 [56:37<3:51:14,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1982/10070 [56:38<3:51:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1982/10070 [56:38<3:51:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1983/10070 [56:39<3:51:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1983/10070 [56:39<3:51:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1984/10070 [56:51<3:51:45,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1984/10070 [56:51<3:51:45,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1985/10070 [56:52<3:51:41,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1985/10070 [56:52<3:51:41,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1986/10070 [56:54<3:51:39,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1986/10070 [56:54<3:51:39,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1987/10070 [56:56<3:51:40,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1987/10070 [56:56<3:51:40,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1988/10070 [56:58<3:51:36,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 1988/10070 [56:58<3:51:36,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1989/10070 [56:58<3:51:30,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1989/10070 [56:58<3:51:30,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1990/10070 [57:01<3:51:30,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1990/10070 [57:01<3:51:30,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1991/10070 [57:02<3:51:27,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 1991/10070 [57:02<3:51:27,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1992/10070 [57:03<3:51:21,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1992/10070 [57:03<3:51:21,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1993/10070 [57:04<3:51:17,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1993/10070 [57:04<3:51:17,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1994/10070 [57:05<3:51:13,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1994/10070 [57:05<3:51:13,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1995/10070 [57:06<3:51:07,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1995/10070 [57:06<3:51:07,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1996/10070 [57:07<3:51:06,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1996/10070 [57:07<3:51:06,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1997/10070 [57:09<3:51:04,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 1997/10070 [57:09<3:51:04,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1998/10070 [57:10<3:51:00,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 1998/10070 [57:10<3:51:00,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 1999/10070 [57:11<3:50:54,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 1999/10070 [57:11<3:50:54,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2000/10070 [57:12<3:50:48,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2000/10070 [57:12<3:50:48,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2001/10070 [57:14<3:50:49,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2001/10070 [57:14<3:50:49,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2002/10070 [57:15<3:50:43,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 2002/10070 [57:15<3:50:43,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2003/10070 [57:17<3:50:44,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2003/10070 [57:17<3:50:44,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2004/10070 [57:18<3:50:40,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  20%|▏| 2004/10070 [57:18<3:50:40,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2005/10070 [57:19<3:50:34,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2005/10070 [57:19<3:50:34,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2006/10070 [57:19<3:50:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2006/10070 [57:19<3:50:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2007/10070 [57:21<3:50:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2007/10070 [57:21<3:50:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2008/10070 [57:22<3:50:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2008/10070 [57:22<3:50:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2009/10070 [57:23<3:50:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2009/10070 [57:23<3:50:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2010/10070 [57:25<3:50:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2010/10070 [57:25<3:50:17,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2011/10070 [57:27<3:50:15,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  20%|▏| 2011/10070 [57:27<3:50:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2012/10070 [57:28<3:50:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2012/10070 [57:28<3:50:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2013/10070 [57:29<3:50:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2013/10070 [57:29<3:50:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2014/10070 [57:31<3:50:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2014/10070 [57:31<3:50:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2015/10070 [57:32<3:50:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2015/10070 [57:32<3:50:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2016/10070 [57:42<3:50:33,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2016/10070 [57:42<3:50:33,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2017/10070 [57:43<3:50:27,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2017/10070 [57:43<3:50:27,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2018/10070 [57:43<3:50:21,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2018/10070 [57:43<3:50:21,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2019/10070 [57:45<3:50:17,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2019/10070 [57:45<3:50:17,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2020/10070 [57:47<3:50:18,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2020/10070 [57:47<3:50:18,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2021/10070 [57:49<3:50:18,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 2021/10070 [57:49<3:50:18,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2022/10070 [57:51<3:50:16,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 2022/10070 [57:51<3:50:16,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2023/10070 [57:53<3:50:15,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2023/10070 [57:53<3:50:15,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2024/10070 [57:54<3:50:11,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2024/10070 [57:54<3:50:11,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2025/10070 [57:56<3:50:09,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2025/10070 [57:56<3:50:09,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2026/10070 [57:58<3:50:10,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2026/10070 [57:58<3:50:10,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2027/10070 [58:00<3:50:08,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 2027/10070 [58:00<3:50:08,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2028/10070 [58:01<3:50:04,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2028/10070 [58:01<3:50:04,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2029/10070 [58:02<3:50:03,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2029/10070 [58:02<3:50:03,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2030/10070 [58:03<3:49:57,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2030/10070 [58:03<3:49:57,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2031/10070 [58:04<3:49:53,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2031/10070 [58:04<3:49:53,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2032/10070 [58:07<3:49:54,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2032/10070 [58:07<3:49:54,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2033/10070 [58:09<3:49:56,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 2033/10070 [58:09<3:49:56,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2034/10070 [58:10<3:49:50,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 2034/10070 [58:10<3:49:50,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2035/10070 [58:11<3:49:47,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2035/10070 [58:11<3:49:47,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2036/10070 [58:13<3:49:43,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2036/10070 [58:13<3:49:43,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2037/10070 [58:14<3:49:39,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2037/10070 [58:14<3:49:39,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2038/10070 [58:15<3:49:36,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2038/10070 [58:15<3:49:36,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2039/10070 [58:17<3:49:34,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2039/10070 [58:17<3:49:34,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2040/10070 [58:18<3:49:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2040/10070 [58:18<3:49:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2041/10070 [58:19<3:49:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2041/10070 [58:19<3:49:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2042/10070 [58:21<3:49:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2042/10070 [58:21<3:49:25,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2043/10070 [58:22<3:49:21,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 2043/10070 [58:22<3:49:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2044/10070 [58:24<3:49:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2044/10070 [58:24<3:49:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2045/10070 [58:26<3:49:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2045/10070 [58:26<3:49:20,  1.71s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2046/10070 [58:28<3:49:18,  1.71s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  20%|▏| 2046/10070 [58:28<3:49:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2047/10070 [58:30<3:49:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2047/10070 [58:30<3:49:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2048/10070 [58:38<3:49:40,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2048/10070 [58:38<3:49:40,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2049/10070 [58:39<3:49:38,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 2049/10070 [58:39<3:49:38,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2050/10070 [58:40<3:49:34,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2050/10070 [58:40<3:49:34,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2051/10070 [58:42<3:49:31,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2051/10070 [58:42<3:49:31,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2052/10070 [58:44<3:49:31,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2052/10070 [58:44<3:49:31,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2053/10070 [58:46<3:49:31,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  20%|▏| 2053/10070 [58:46<3:49:31,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2054/10070 [58:48<3:49:30,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 2054/10070 [58:48<3:49:30,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2055/10070 [58:50<3:49:30,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2055/10070 [58:50<3:49:30,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2056/10070 [58:52<3:49:28,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 2056/10070 [58:52<3:49:28,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2057/10070 [58:54<3:49:27,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2057/10070 [58:54<3:49:27,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2058/10070 [58:55<3:49:23,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  20%|▏| 2058/10070 [58:55<3:49:23,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2059/10070 [58:57<3:49:21,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2059/10070 [58:57<3:49:21,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2060/10070 [58:57<3:49:16,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2060/10070 [58:57<3:49:16,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2061/10070 [58:59<3:49:14,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2061/10070 [58:59<3:49:14,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2062/10070 [59:00<3:49:10,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2062/10070 [59:00<3:49:10,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2063/10070 [59:01<3:49:06,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2063/10070 [59:01<3:49:06,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  20%|▏| 2064/10070 [59:03<3:49:03,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  20%|▏| 2064/10070 [59:03<3:49:03,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2065/10070 [59:03<3:48:57,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2065/10070 [59:03<3:48:57,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2066/10070 [59:05<3:48:55,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2066/10070 [59:05<3:48:55,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2067/10070 [59:06<3:48:49,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2067/10070 [59:06<3:48:49,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2068/10070 [59:06<3:48:44,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2068/10070 [59:06<3:48:44,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2069/10070 [59:07<3:48:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2069/10070 [59:07<3:48:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2070/10070 [59:08<3:48:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2070/10070 [59:08<3:48:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2071/10070 [59:09<3:48:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2071/10070 [59:09<3:48:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2072/10070 [59:10<3:48:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2072/10070 [59:10<3:48:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2073/10070 [59:12<3:48:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2073/10070 [59:12<3:48:25,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2074/10070 [59:14<3:48:25,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  21%|▏| 2074/10070 [59:14<3:48:25,  1.71s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2075/10070 [59:16<3:48:21,  1.71s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  21%|▏| 2075/10070 [59:16<3:48:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2076/10070 [59:17<3:48:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2076/10070 [59:17<3:48:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2077/10070 [59:17<3:48:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2077/10070 [59:17<3:48:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2078/10070 [59:19<3:48:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2078/10070 [59:19<3:48:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2079/10070 [59:20<3:48:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2079/10070 [59:20<3:48:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2080/10070 [59:29<3:48:32,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2080/10070 [59:29<3:48:32,  1.72s/it, v_num=tif6, train/loss=2."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2081/10070 [59:31<3:48:30,  1.72s/it, v_num=tif6, train/loss=2.\r",
-      "Epoch 0:  21%|▏| 2081/10070 [59:31<3:48:30,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2082/10070 [59:33<3:48:28,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2082/10070 [59:33<3:48:28,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2083/10070 [59:34<3:48:26,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2083/10070 [59:34<3:48:26,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2084/10070 [59:36<3:48:25,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2084/10070 [59:36<3:48:25,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2085/10070 [59:37<3:48:21,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2085/10070 [59:37<3:48:21,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2086/10070 [59:38<3:48:17,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2086/10070 [59:38<3:48:17,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2087/10070 [59:40<3:48:14,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2087/10070 [59:40<3:48:14,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2088/10070 [59:42<3:48:14,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2088/10070 [59:42<3:48:14,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2089/10070 [59:44<3:48:15,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  21%|▏| 2089/10070 [59:44<3:48:15,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2090/10070 [59:46<3:48:15,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  21%|▏| 2090/10070 [59:46<3:48:15,  1.72s/it, v_num=tif6, train/loss=1."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2091/10070 [59:48<3:48:14,  1.72s/it, v_num=tif6, train/loss=1.\r",
-      "Epoch 0:  21%|▏| 2091/10070 [59:48<3:48:14,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2092/10070 [59:50<3:48:12,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2092/10070 [59:50<3:48:12,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2093/10070 [59:51<3:48:06,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2093/10070 [59:51<3:48:06,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2094/10070 [59:52<3:48:05,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2094/10070 [59:52<3:48:05,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2095/10070 [59:53<3:47:59,  1.72s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2095/10070 [59:53<3:47:59,  1.72s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2096/10070 [59:54<3:47:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2096/10070 [59:54<3:47:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2097/10070 [59:55<3:47:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2097/10070 [59:55<3:47:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2098/10070 [59:57<3:47:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2098/10070 [59:57<3:47:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2099/10070 [59:58<3:47:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2099/10070 [59:58<3:47:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2100/10070 [59:59<3:47:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  21%|▏| 2100/10070 [59:59<3:47:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2101/10070 [1:00:00<3:47:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2101/10070 [1:00:00<3:47:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2102/10070 [1:00:02<3:47:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2102/10070 [1:00:02<3:47:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2103/10070 [1:00:04<3:47:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2103/10070 [1:00:04<3:47:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2104/10070 [1:00:06<3:47:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2104/10070 [1:00:06<3:47:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2105/10070 [1:00:07<3:47:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2105/10070 [1:00:07<3:47:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2106/10070 [1:00:09<3:47:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2106/10070 [1:00:09<3:47:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2107/10070 [1:00:11<3:47:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2107/10070 [1:00:11<3:47:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2108/10070 [1:00:12<3:47:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2108/10070 [1:00:12<3:47:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2109/10070 [1:00:15<3:47:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2109/10070 [1:00:15<3:47:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2110/10070 [1:00:16<3:47:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2110/10070 [1:00:16<3:47:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2111/10070 [1:00:17<3:47:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2111/10070 [1:00:17<3:47:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2112/10070 [1:00:23<3:47:33,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2112/10070 [1:00:23<3:47:33,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2113/10070 [1:00:24<3:47:29,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2113/10070 [1:00:24<3:47:29,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2114/10070 [1:00:25<3:47:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2114/10070 [1:00:25<3:47:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2115/10070 [1:00:26<3:47:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2115/10070 [1:00:26<3:47:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2116/10070 [1:00:27<3:47:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2116/10070 [1:00:27<3:47:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2117/10070 [1:00:28<3:47:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2117/10070 [1:00:28<3:47:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2118/10070 [1:00:29<3:47:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2118/10070 [1:00:29<3:47:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2119/10070 [1:00:30<3:47:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2119/10070 [1:00:30<3:47:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2120/10070 [1:00:31<3:46:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2120/10070 [1:00:31<3:46:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2121/10070 [1:00:32<3:46:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2121/10070 [1:00:32<3:46:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2122/10070 [1:00:33<3:46:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2122/10070 [1:00:33<3:46:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2123/10070 [1:00:35<3:46:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2123/10070 [1:00:35<3:46:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2124/10070 [1:00:37<3:46:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2124/10070 [1:00:37<3:46:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2125/10070 [1:00:38<3:46:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2125/10070 [1:00:38<3:46:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2126/10070 [1:00:39<3:46:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2126/10070 [1:00:39<3:46:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2127/10070 [1:00:40<3:46:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2127/10070 [1:00:40<3:46:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2128/10070 [1:00:40<3:46:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2128/10070 [1:00:40<3:46:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2129/10070 [1:00:42<3:46:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2129/10070 [1:00:42<3:46:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2130/10070 [1:00:43<3:46:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2130/10070 [1:00:43<3:46:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2131/10070 [1:00:44<3:46:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2131/10070 [1:00:44<3:46:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2132/10070 [1:00:46<3:46:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2132/10070 [1:00:46<3:46:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2133/10070 [1:00:47<3:46:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2133/10070 [1:00:47<3:46:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2134/10070 [1:00:48<3:46:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2134/10070 [1:00:48<3:46:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2135/10070 [1:00:49<3:46:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2135/10070 [1:00:49<3:46:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2136/10070 [1:00:52<3:46:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2136/10070 [1:00:52<3:46:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2137/10070 [1:00:54<3:46:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2137/10070 [1:00:54<3:46:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2138/10070 [1:00:56<3:46:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2138/10070 [1:00:56<3:46:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2139/10070 [1:00:56<3:45:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2139/10070 [1:00:56<3:45:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2140/10070 [1:00:58<3:45:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2140/10070 [1:00:58<3:45:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2141/10070 [1:01:00<3:45:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2141/10070 [1:01:00<3:45:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2142/10070 [1:01:01<3:45:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2142/10070 [1:01:01<3:45:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2143/10070 [1:01:02<3:45:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2143/10070 [1:01:02<3:45:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2144/10070 [1:01:21<3:46:49,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2144/10070 [1:01:21<3:46:49,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2145/10070 [1:01:23<3:46:49,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2145/10070 [1:01:23<3:46:49,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2146/10070 [1:01:24<3:46:45,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2146/10070 [1:01:24<3:46:45,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2147/10070 [1:01:27<3:46:46,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2147/10070 [1:01:27<3:46:46,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2148/10070 [1:01:27<3:46:40,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2148/10070 [1:01:27<3:46:40,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2149/10070 [1:01:29<3:46:40,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2149/10070 [1:01:29<3:46:40,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2150/10070 [1:01:30<3:46:35,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2150/10070 [1:01:30<3:46:35,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2151/10070 [1:01:31<3:46:29,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2151/10070 [1:01:31<3:46:29,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2152/10070 [1:01:33<3:46:30,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2152/10070 [1:01:33<3:46:30,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2153/10070 [1:01:34<3:46:24,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2153/10070 [1:01:34<3:46:24,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|��| 2154/10070 [1:01:34<3:46:19,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2154/10070 [1:01:34<3:46:19,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2155/10070 [1:01:35<3:46:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2155/10070 [1:01:35<3:46:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2156/10070 [1:01:37<3:46:14,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2156/10070 [1:01:37<3:46:14,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2157/10070 [1:01:40<3:46:14,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2157/10070 [1:01:40<3:46:14,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2158/10070 [1:01:41<3:46:10,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2158/10070 [1:01:41<3:46:10,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2159/10070 [1:01:42<3:46:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2159/10070 [1:01:42<3:46:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2160/10070 [1:01:42<3:45:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2160/10070 [1:01:42<3:45:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2161/10070 [1:01:45<3:46:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2161/10070 [1:01:45<3:46:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2162/10070 [1:01:46<3:45:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2162/10070 [1:01:46<3:45:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2163/10070 [1:01:47<3:45:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2163/10070 [1:01:47<3:45:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2164/10070 [1:01:49<3:45:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2164/10070 [1:01:49<3:45:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  21%|▏| 2165/10070 [1:01:50<3:45:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  21%|▏| 2165/10070 [1:01:50<3:45:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2166/10070 [1:01:52<3:45:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2166/10070 [1:01:52<3:45:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2167/10070 [1:01:53<3:45:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2167/10070 [1:01:53<3:45:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2168/10070 [1:01:54<3:45:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2168/10070 [1:01:54<3:45:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2169/10070 [1:01:55<3:45:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2169/10070 [1:01:55<3:45:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2170/10070 [1:01:57<3:45:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2170/10070 [1:01:57<3:45:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2171/10070 [1:01:58<3:45:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2171/10070 [1:01:58<3:45:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2172/10070 [1:01:59<3:45:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2172/10070 [1:01:59<3:45:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2173/10070 [1:02:02<3:45:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2173/10070 [1:02:02<3:45:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2174/10070 [1:02:03<3:45:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2174/10070 [1:02:03<3:45:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2175/10070 [1:02:04<3:45:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2175/10070 [1:02:04<3:45:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2176/10070 [1:02:17<3:45:58,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2176/10070 [1:02:17<3:45:58,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2177/10070 [1:02:18<3:45:54,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2177/10070 [1:02:18<3:45:54,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2178/10070 [1:02:19<3:45:49,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2178/10070 [1:02:19<3:45:49,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2179/10070 [1:02:20<3:45:44,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2179/10070 [1:02:20<3:45:44,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2180/10070 [1:02:22<3:45:44,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2180/10070 [1:02:22<3:45:44,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2181/10070 [1:02:24<3:45:42,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2181/10070 [1:02:24<3:45:42,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2182/10070 [1:02:25<3:45:41,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2182/10070 [1:02:25<3:45:41,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2183/10070 [1:02:27<3:45:39,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2183/10070 [1:02:27<3:45:39,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2184/10070 [1:02:28<3:45:34,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2184/10070 [1:02:28<3:45:34,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2185/10070 [1:02:29<3:45:30,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2185/10070 [1:02:29<3:45:30,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2186/10070 [1:02:31<3:45:30,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2186/10070 [1:02:31<3:45:30,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2187/10070 [1:02:33<3:45:29,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2187/10070 [1:02:33<3:45:29,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2188/10070 [1:02:34<3:45:23,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2188/10070 [1:02:34<3:45:23,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2189/10070 [1:02:35<3:45:20,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2189/10070 [1:02:35<3:45:20,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2190/10070 [1:02:36<3:45:16,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2190/10070 [1:02:36<3:45:16,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2191/10070 [1:02:38<3:45:14,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2191/10070 [1:02:38<3:45:14,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2192/10070 [1:02:39<3:45:11,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2192/10070 [1:02:39<3:45:11,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2193/10070 [1:02:40<3:45:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2193/10070 [1:02:40<3:45:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2194/10070 [1:02:42<3:45:08,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2194/10070 [1:02:42<3:45:08,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2195/10070 [1:02:43<3:45:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2195/10070 [1:02:43<3:45:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2196/10070 [1:02:44<3:44:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2196/10070 [1:02:44<3:44:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2197/10070 [1:02:46<3:44:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2197/10070 [1:02:46<3:44:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2198/10070 [1:02:47<3:44:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2198/10070 [1:02:47<3:44:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2199/10070 [1:02:48<3:44:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2199/10070 [1:02:48<3:44:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2200/10070 [1:02:51<3:44:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2200/10070 [1:02:51<3:44:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2201/10070 [1:02:52<3:44:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2201/10070 [1:02:52<3:44:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2202/10070 [1:02:54<3:44:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2202/10070 [1:02:54<3:44:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2203/10070 [1:02:55<3:44:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2203/10070 [1:02:55<3:44:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2204/10070 [1:02:57<3:44:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2204/10070 [1:02:57<3:44:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2205/10070 [1:02:59<3:44:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2205/10070 [1:02:59<3:44:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2206/10070 [1:03:00<3:44:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2206/10070 [1:03:00<3:44:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2207/10070 [1:03:00<3:44:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2207/10070 [1:03:00<3:44:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2208/10070 [1:03:10<3:44:57,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2208/10070 [1:03:10<3:44:57,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2209/10070 [1:03:12<3:44:57,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2209/10070 [1:03:12<3:44:57,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2210/10070 [1:03:15<3:44:58,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2210/10070 [1:03:15<3:44:58,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2211/10070 [1:03:15<3:44:52,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2211/10070 [1:03:15<3:44:52,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2212/10070 [1:03:17<3:44:49,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2212/10070 [1:03:17<3:44:49,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2213/10070 [1:03:19<3:44:49,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2213/10070 [1:03:19<3:44:49,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2214/10070 [1:03:20<3:44:44,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2214/10070 [1:03:20<3:44:44,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2215/10070 [1:03:21<3:44:40,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2215/10070 [1:03:21<3:44:40,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2216/10070 [1:03:23<3:44:39,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2216/10070 [1:03:23<3:44:39,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2217/10070 [1:03:25<3:44:39,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2217/10070 [1:03:25<3:44:39,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2218/10070 [1:03:26<3:44:35,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2218/10070 [1:03:26<3:44:35,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2219/10070 [1:03:27<3:44:32,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2219/10070 [1:03:27<3:44:32,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2220/10070 [1:03:29<3:44:32,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2220/10070 [1:03:29<3:44:32,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2221/10070 [1:03:31<3:44:30,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2221/10070 [1:03:31<3:44:30,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2222/10070 [1:03:32<3:44:25,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2222/10070 [1:03:32<3:44:25,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2223/10070 [1:03:33<3:44:21,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2223/10070 [1:03:33<3:44:21,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2224/10070 [1:03:34<3:44:16,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2224/10070 [1:03:34<3:44:16,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2225/10070 [1:03:34<3:44:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2225/10070 [1:03:34<3:44:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2226/10070 [1:03:36<3:44:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2226/10070 [1:03:36<3:44:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2227/10070 [1:03:37<3:44:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2227/10070 [1:03:37<3:44:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2228/10070 [1:03:39<3:44:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2228/10070 [1:03:39<3:44:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2229/10070 [1:03:41<3:44:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2229/10070 [1:03:41<3:44:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2230/10070 [1:03:42<3:43:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2230/10070 [1:03:42<3:43:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2231/10070 [1:03:42<3:43:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2231/10070 [1:03:42<3:43:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2232/10070 [1:03:43<3:43:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2232/10070 [1:03:43<3:43:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2233/10070 [1:03:44<3:43:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2233/10070 [1:03:44<3:43:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2234/10070 [1:03:44<3:43:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2234/10070 [1:03:44<3:43:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2235/10070 [1:03:45<3:43:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2235/10070 [1:03:45<3:43:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2236/10070 [1:03:46<3:43:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2236/10070 [1:03:46<3:43:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2237/10070 [1:03:47<3:43:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2237/10070 [1:03:47<3:43:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2238/10070 [1:03:48<3:43:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2238/10070 [1:03:48<3:43:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2239/10070 [1:03:50<3:43:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2239/10070 [1:03:50<3:43:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2240/10070 [1:04:02<3:43:49,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2240/10070 [1:04:02<3:43:49,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2241/10070 [1:04:03<3:43:48,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2241/10070 [1:04:03<3:43:48,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2242/10070 [1:04:04<3:43:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2242/10070 [1:04:04<3:43:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2243/10070 [1:04:06<3:43:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2243/10070 [1:04:06<3:43:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2244/10070 [1:04:08<3:43:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2244/10070 [1:04:08<3:43:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2245/10070 [1:04:10<3:43:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2245/10070 [1:04:10<3:43:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2246/10070 [1:04:10<3:43:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2246/10070 [1:04:10<3:43:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2247/10070 [1:04:13<3:43:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2247/10070 [1:04:13<3:43:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2248/10070 [1:04:14<3:43:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2248/10070 [1:04:14<3:43:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2249/10070 [1:04:15<3:43:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2249/10070 [1:04:15<3:43:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2250/10070 [1:04:17<3:43:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2250/10070 [1:04:17<3:43:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2251/10070 [1:04:18<3:43:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2251/10070 [1:04:18<3:43:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2252/10070 [1:04:21<3:43:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2252/10070 [1:04:21<3:43:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2253/10070 [1:04:23<3:43:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2253/10070 [1:04:23<3:43:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2254/10070 [1:04:24<3:43:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2254/10070 [1:04:24<3:43:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2255/10070 [1:04:26<3:43:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2255/10070 [1:04:26<3:43:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2256/10070 [1:04:27<3:43:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2256/10070 [1:04:27<3:43:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2257/10070 [1:04:28<3:43:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2257/10070 [1:04:28<3:43:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2258/10070 [1:04:30<3:43:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2258/10070 [1:04:30<3:43:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2259/10070 [1:04:32<3:43:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2259/10070 [1:04:32<3:43:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2260/10070 [1:04:33<3:43:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2260/10070 [1:04:33<3:43:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2261/10070 [1:04:34<3:43:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2261/10070 [1:04:34<3:43:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2262/10070 [1:04:35<3:42:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2262/10070 [1:04:35<3:42:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2263/10070 [1:04:36<3:42:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2263/10070 [1:04:36<3:42:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2264/10070 [1:04:37<3:42:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2264/10070 [1:04:37<3:42:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  22%|▏| 2265/10070 [1:04:38<3:42:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  22%|▏| 2265/10070 [1:04:38<3:42:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2266/10070 [1:04:40<3:42:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2266/10070 [1:04:40<3:42:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2267/10070 [1:04:42<3:42:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2267/10070 [1:04:42<3:42:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2268/10070 [1:04:44<3:42:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2268/10070 [1:04:44<3:42:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2269/10070 [1:04:45<3:42:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2269/10070 [1:04:45<3:42:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2270/10070 [1:04:45<3:42:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2270/10070 [1:04:45<3:42:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2271/10070 [1:04:47<3:42:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2271/10070 [1:04:47<3:42:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2272/10070 [1:04:54<3:42:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2272/10070 [1:04:54<3:42:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2273/10070 [1:04:55<3:42:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2273/10070 [1:04:55<3:42:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2274/10070 [1:04:56<3:42:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2274/10070 [1:04:56<3:42:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2275/10070 [1:04:57<3:42:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2275/10070 [1:04:57<3:42:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2276/10070 [1:04:59<3:42:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2276/10070 [1:04:59<3:42:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2277/10070 [1:05:01<3:42:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2277/10070 [1:05:01<3:42:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2278/10070 [1:05:02<3:42:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2278/10070 [1:05:02<3:42:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2279/10070 [1:05:04<3:42:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2279/10070 [1:05:04<3:42:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2280/10070 [1:05:06<3:42:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2280/10070 [1:05:06<3:42:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2281/10070 [1:05:07<3:42:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2281/10070 [1:05:07<3:42:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2282/10070 [1:05:10<3:42:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2282/10070 [1:05:10<3:42:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2283/10070 [1:05:11<3:42:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2283/10070 [1:05:11<3:42:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2284/10070 [1:05:13<3:42:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2284/10070 [1:05:13<3:42:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2285/10070 [1:05:14<3:42:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2285/10070 [1:05:14<3:42:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2286/10070 [1:05:15<3:42:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2286/10070 [1:05:15<3:42:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2287/10070 [1:05:17<3:42:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2287/10070 [1:05:17<3:42:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2288/10070 [1:05:18<3:42:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2288/10070 [1:05:18<3:42:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2289/10070 [1:05:19<3:42:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2289/10070 [1:05:19<3:42:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2290/10070 [1:05:20<3:41:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2290/10070 [1:05:20<3:41:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2291/10070 [1:05:22<3:41:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2291/10070 [1:05:22<3:41:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2292/10070 [1:05:23<3:41:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2292/10070 [1:05:23<3:41:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2293/10070 [1:05:25<3:41:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2293/10070 [1:05:25<3:41:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2294/10070 [1:05:26<3:41:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2294/10070 [1:05:26<3:41:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2295/10070 [1:05:28<3:41:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2295/10070 [1:05:28<3:41:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2296/10070 [1:05:29<3:41:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2296/10070 [1:05:29<3:41:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2297/10070 [1:05:31<3:41:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2297/10070 [1:05:31<3:41:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2298/10070 [1:05:32<3:41:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2298/10070 [1:05:32<3:41:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2299/10070 [1:05:33<3:41:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2299/10070 [1:05:33<3:41:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2300/10070 [1:05:35<3:41:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2300/10070 [1:05:35<3:41:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2301/10070 [1:05:37<3:41:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2301/10070 [1:05:37<3:41:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2302/10070 [1:05:39<3:41:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2302/10070 [1:05:39<3:41:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2303/10070 [1:05:40<3:41:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2303/10070 [1:05:40<3:41:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2304/10070 [1:05:48<3:41:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2304/10070 [1:05:48<3:41:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2305/10070 [1:05:49<3:41:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2305/10070 [1:05:49<3:41:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2306/10070 [1:05:50<3:41:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2306/10070 [1:05:50<3:41:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2307/10070 [1:05:51<3:41:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2307/10070 [1:05:51<3:41:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2308/10070 [1:05:51<3:41:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2308/10070 [1:05:51<3:41:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2309/10070 [1:05:53<3:41:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2309/10070 [1:05:53<3:41:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2310/10070 [1:05:55<3:41:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2310/10070 [1:05:55<3:41:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2311/10070 [1:05:56<3:41:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2311/10070 [1:05:56<3:41:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2312/10070 [1:05:57<3:41:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2312/10070 [1:05:57<3:41:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2313/10070 [1:05:58<3:41:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2313/10070 [1:05:58<3:41:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2314/10070 [1:06:00<3:41:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2314/10070 [1:06:00<3:41:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2315/10070 [1:06:02<3:41:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2315/10070 [1:06:02<3:41:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2316/10070 [1:06:04<3:41:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2316/10070 [1:06:04<3:41:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2317/10070 [1:06:05<3:41:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2317/10070 [1:06:05<3:41:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2318/10070 [1:06:07<3:41:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2318/10070 [1:06:07<3:41:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2319/10070 [1:06:08<3:41:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2319/10070 [1:06:08<3:41:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2320/10070 [1:06:08<3:40:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2320/10070 [1:06:08<3:40:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2321/10070 [1:06:10<3:40:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2321/10070 [1:06:10<3:40:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2322/10070 [1:06:12<3:40:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2322/10070 [1:06:12<3:40:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2323/10070 [1:06:13<3:40:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2323/10070 [1:06:13<3:40:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2324/10070 [1:06:15<3:40:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2324/10070 [1:06:15<3:40:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2325/10070 [1:06:16<3:40:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2325/10070 [1:06:16<3:40:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2326/10070 [1:06:17<3:40:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2326/10070 [1:06:17<3:40:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2327/10070 [1:06:20<3:40:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2327/10070 [1:06:20<3:40:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2328/10070 [1:06:21<3:40:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2328/10070 [1:06:21<3:40:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2329/10070 [1:06:23<3:40:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2329/10070 [1:06:23<3:40:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2330/10070 [1:06:25<3:40:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2330/10070 [1:06:25<3:40:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2331/10070 [1:06:26<3:40:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2331/10070 [1:06:26<3:40:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2332/10070 [1:06:28<3:40:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2332/10070 [1:06:28<3:40:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2333/10070 [1:06:29<3:40:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2333/10070 [1:06:29<3:40:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2334/10070 [1:06:32<3:40:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2334/10070 [1:06:32<3:40:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2335/10070 [1:06:34<3:40:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2335/10070 [1:06:34<3:40:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2336/10070 [1:06:43<3:40:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2336/10070 [1:06:43<3:40:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2337/10070 [1:06:44<3:40:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2337/10070 [1:06:44<3:40:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2338/10070 [1:06:46<3:40:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2338/10070 [1:06:46<3:40:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2339/10070 [1:06:47<3:40:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2339/10070 [1:06:47<3:40:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2340/10070 [1:06:48<3:40:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2340/10070 [1:06:48<3:40:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2341/10070 [1:06:50<3:40:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2341/10070 [1:06:50<3:40:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2342/10070 [1:06:52<3:40:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2342/10070 [1:06:52<3:40:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2343/10070 [1:06:53<3:40:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2343/10070 [1:06:53<3:40:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2344/10070 [1:06:55<3:40:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2344/10070 [1:06:55<3:40:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2345/10070 [1:06:55<3:40:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2345/10070 [1:06:55<3:40:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2346/10070 [1:06:56<3:40:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2346/10070 [1:06:56<3:40:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2347/10070 [1:06:58<3:40:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2347/10070 [1:06:58<3:40:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2348/10070 [1:06:59<3:40:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2348/10070 [1:06:59<3:40:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2349/10070 [1:07:01<3:40:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2349/10070 [1:07:01<3:40:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2350/10070 [1:07:02<3:40:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2350/10070 [1:07:02<3:40:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2351/10070 [1:07:03<3:40:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2351/10070 [1:07:03<3:40:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2352/10070 [1:07:05<3:40:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2352/10070 [1:07:05<3:40:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2353/10070 [1:07:07<3:40:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2353/10070 [1:07:07<3:40:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2354/10070 [1:07:09<3:40:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2354/10070 [1:07:09<3:40:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2355/10070 [1:07:10<3:40:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2355/10070 [1:07:10<3:40:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2356/10070 [1:07:12<3:40:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2356/10070 [1:07:12<3:40:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2357/10070 [1:07:13<3:39:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2357/10070 [1:07:13<3:39:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2358/10070 [1:07:15<3:39:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2358/10070 [1:07:15<3:39:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2359/10070 [1:07:17<3:39:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2359/10070 [1:07:17<3:39:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2360/10070 [1:07:17<3:39:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2360/10070 [1:07:17<3:39:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2361/10070 [1:07:19<3:39:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2361/10070 [1:07:19<3:39:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2362/10070 [1:07:20<3:39:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2362/10070 [1:07:20<3:39:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2363/10070 [1:07:21<3:39:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2363/10070 [1:07:21<3:39:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2364/10070 [1:07:24<3:39:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2364/10070 [1:07:24<3:39:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2365/10070 [1:07:25<3:39:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2365/10070 [1:07:25<3:39:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  23%|▏| 2366/10070 [1:07:25<3:39:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  23%|▏| 2366/10070 [1:07:25<3:39:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2367/10070 [1:07:27<3:39:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2367/10070 [1:07:27<3:39:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2368/10070 [1:07:37<3:39:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2368/10070 [1:07:37<3:39:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2369/10070 [1:07:37<3:39:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2369/10070 [1:07:37<3:39:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2370/10070 [1:07:40<3:39:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2370/10070 [1:07:40<3:39:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2371/10070 [1:07:41<3:39:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2371/10070 [1:07:41<3:39:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2372/10070 [1:07:42<3:39:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2372/10070 [1:07:42<3:39:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2373/10070 [1:07:44<3:39:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2373/10070 [1:07:44<3:39:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2374/10070 [1:07:45<3:39:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2374/10070 [1:07:45<3:39:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2375/10070 [1:07:47<3:39:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2375/10070 [1:07:47<3:39:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2376/10070 [1:07:48<3:39:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2376/10070 [1:07:48<3:39:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2377/10070 [1:07:49<3:39:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2377/10070 [1:07:49<3:39:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2378/10070 [1:07:50<3:39:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2378/10070 [1:07:50<3:39:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2379/10070 [1:07:51<3:39:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2379/10070 [1:07:51<3:39:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2380/10070 [1:07:52<3:39:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2380/10070 [1:07:52<3:39:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2381/10070 [1:07:54<3:39:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2381/10070 [1:07:54<3:39:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2382/10070 [1:07:56<3:39:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2382/10070 [1:07:56<3:39:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2383/10070 [1:07:57<3:39:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2383/10070 [1:07:57<3:39:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2384/10070 [1:07:59<3:39:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2384/10070 [1:07:59<3:39:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2385/10070 [1:08:01<3:39:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2385/10070 [1:08:01<3:39:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2386/10070 [1:08:03<3:39:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2386/10070 [1:08:03<3:39:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2387/10070 [1:08:05<3:39:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2387/10070 [1:08:05<3:39:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2388/10070 [1:08:07<3:39:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2388/10070 [1:08:07<3:39:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2389/10070 [1:08:09<3:39:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2389/10070 [1:08:09<3:39:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2390/10070 [1:08:11<3:39:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2390/10070 [1:08:11<3:39:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2391/10070 [1:08:13<3:39:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2391/10070 [1:08:13<3:39:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2392/10070 [1:08:14<3:39:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2392/10070 [1:08:14<3:39:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2393/10070 [1:08:16<3:39:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2393/10070 [1:08:16<3:39:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2394/10070 [1:08:16<3:38:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2394/10070 [1:08:16<3:38:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2395/10070 [1:08:17<3:38:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2395/10070 [1:08:17<3:38:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2396/10070 [1:08:19<3:38:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2396/10070 [1:08:19<3:38:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2397/10070 [1:08:20<3:38:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2397/10070 [1:08:20<3:38:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2398/10070 [1:08:21<3:38:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2398/10070 [1:08:21<3:38:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2399/10070 [1:08:23<3:38:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2399/10070 [1:08:23<3:38:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2400/10070 [1:08:30<3:38:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2400/10070 [1:08:30<3:38:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2401/10070 [1:08:53<3:40:01,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2401/10070 [1:08:53<3:40:01,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2402/10070 [1:08:54<3:40:00,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2402/10070 [1:08:54<3:40:00,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2403/10070 [1:08:56<3:39:58,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2403/10070 [1:08:56<3:39:58,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2404/10070 [1:08:57<3:39:53,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2404/10070 [1:08:57<3:39:53,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2405/10070 [1:08:58<3:39:50,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2405/10070 [1:08:58<3:39:50,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2406/10070 [1:08:59<3:39:46,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2406/10070 [1:08:59<3:39:46,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2407/10070 [1:09:01<3:39:45,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2407/10070 [1:09:01<3:39:45,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2408/10070 [1:09:02<3:39:40,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2408/10070 [1:09:02<3:39:40,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2409/10070 [1:09:02<3:39:35,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2409/10070 [1:09:02<3:39:35,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2410/10070 [1:09:03<3:39:30,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2410/10070 [1:09:03<3:39:30,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2411/10070 [1:09:05<3:39:28,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2411/10070 [1:09:05<3:39:28,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2412/10070 [1:09:06<3:39:23,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2412/10070 [1:09:06<3:39:23,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2413/10070 [1:09:07<3:39:21,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2413/10070 [1:09:07<3:39:21,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2414/10070 [1:09:09<3:39:18,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2414/10070 [1:09:09<3:39:18,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2415/10070 [1:09:10<3:39:16,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2415/10070 [1:09:10<3:39:16,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2416/10070 [1:09:12<3:39:15,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2416/10070 [1:09:12<3:39:15,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2417/10070 [1:09:14<3:39:15,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2417/10070 [1:09:14<3:39:15,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2418/10070 [1:09:15<3:39:11,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2418/10070 [1:09:15<3:39:11,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2419/10070 [1:09:17<3:39:08,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2419/10070 [1:09:17<3:39:08,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2420/10070 [1:09:18<3:39:06,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2420/10070 [1:09:18<3:39:06,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2421/10070 [1:09:19<3:39:01,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2421/10070 [1:09:19<3:39:01,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2422/10070 [1:09:20<3:38:56,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2422/10070 [1:09:20<3:38:56,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2423/10070 [1:09:22<3:38:56,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2423/10070 [1:09:22<3:38:56,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2424/10070 [1:09:24<3:38:56,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2424/10070 [1:09:24<3:38:56,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2425/10070 [1:09:26<3:38:55,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2425/10070 [1:09:26<3:38:55,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2426/10070 [1:09:28<3:38:53,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2426/10070 [1:09:28<3:38:53,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2427/10070 [1:09:28<3:38:48,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2427/10070 [1:09:28<3:38:48,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2428/10070 [1:09:30<3:38:45,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2428/10070 [1:09:30<3:38:45,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2429/10070 [1:09:30<3:38:40,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2429/10070 [1:09:30<3:38:40,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2430/10070 [1:09:32<3:38:38,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2430/10070 [1:09:32<3:38:38,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2431/10070 [1:09:34<3:38:38,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2431/10070 [1:09:34<3:38:38,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2432/10070 [1:09:43<3:39:00,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2432/10070 [1:09:43<3:39:00,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2433/10070 [1:09:44<3:38:55,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2433/10070 [1:09:44<3:38:55,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2434/10070 [1:09:46<3:38:53,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2434/10070 [1:09:46<3:38:53,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2435/10070 [1:09:47<3:38:48,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2435/10070 [1:09:47<3:38:48,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2436/10070 [1:09:47<3:38:43,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2436/10070 [1:09:47<3:38:43,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2437/10070 [1:09:48<3:38:38,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2437/10070 [1:09:48<3:38:38,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2438/10070 [1:09:50<3:38:38,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2438/10070 [1:09:50<3:38:38,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2439/10070 [1:09:51<3:38:33,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2439/10070 [1:09:51<3:38:33,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2440/10070 [1:09:52<3:38:29,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2440/10070 [1:09:52<3:38:29,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2441/10070 [1:09:53<3:38:25,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2441/10070 [1:09:53<3:38:25,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2442/10070 [1:09:55<3:38:24,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2442/10070 [1:09:55<3:38:24,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2443/10070 [1:09:55<3:38:19,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2443/10070 [1:09:55<3:38:19,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2444/10070 [1:09:57<3:38:17,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2444/10070 [1:09:57<3:38:17,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2445/10070 [1:09:59<3:38:16,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2445/10070 [1:09:59<3:38:16,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2446/10070 [1:09:59<3:38:11,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2446/10070 [1:09:59<3:38:11,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2447/10070 [1:10:00<3:38:06,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2447/10070 [1:10:00<3:38:06,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2448/10070 [1:10:01<3:38:01,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2448/10070 [1:10:01<3:38:01,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2449/10070 [1:10:03<3:37:59,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2449/10070 [1:10:03<3:37:59,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2450/10070 [1:10:05<3:37:59,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2450/10070 [1:10:05<3:37:59,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2451/10070 [1:10:07<3:37:58,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2451/10070 [1:10:07<3:37:58,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2452/10070 [1:10:08<3:37:54,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2452/10070 [1:10:08<3:37:54,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2453/10070 [1:10:09<3:37:51,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2453/10070 [1:10:09<3:37:51,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2454/10070 [1:10:11<3:37:51,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2454/10070 [1:10:11<3:37:51,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2455/10070 [1:10:12<3:37:46,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2455/10070 [1:10:12<3:37:46,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2456/10070 [1:10:13<3:37:43,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2456/10070 [1:10:13<3:37:43,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2457/10070 [1:10:16<3:37:43,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2457/10070 [1:10:16<3:37:43,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2458/10070 [1:10:18<3:37:43,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2458/10070 [1:10:18<3:37:43,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2459/10070 [1:10:18<3:37:38,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2459/10070 [1:10:18<3:37:38,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2460/10070 [1:10:20<3:37:36,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2460/10070 [1:10:20<3:37:36,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2461/10070 [1:10:22<3:37:36,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2461/10070 [1:10:22<3:37:36,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2462/10070 [1:10:23<3:37:31,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2462/10070 [1:10:23<3:37:31,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2463/10070 [1:10:24<3:37:26,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2463/10070 [1:10:24<3:37:26,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2464/10070 [1:10:35<3:37:55,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2464/10070 [1:10:35<3:37:55,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2465/10070 [1:10:38<3:37:55,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2465/10070 [1:10:38<3:37:55,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2466/10070 [1:10:39<3:37:51,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2466/10070 [1:10:39<3:37:51,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  24%|▏| 2467/10070 [1:10:40<3:37:48,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  24%|▏| 2467/10070 [1:10:40<3:37:48,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2468/10070 [1:10:41<3:37:43,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2468/10070 [1:10:41<3:37:43,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2469/10070 [1:10:42<3:37:40,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2469/10070 [1:10:42<3:37:40,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2470/10070 [1:10:43<3:37:35,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2470/10070 [1:10:43<3:37:35,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2471/10070 [1:10:45<3:37:35,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2471/10070 [1:10:45<3:37:35,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2472/10070 [1:10:46<3:37:30,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2472/10070 [1:10:46<3:37:30,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2473/10070 [1:10:48<3:37:30,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2473/10070 [1:10:48<3:37:30,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2474/10070 [1:10:49<3:37:25,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2474/10070 [1:10:49<3:37:25,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2475/10070 [1:10:49<3:37:20,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2475/10070 [1:10:49<3:37:20,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2476/10070 [1:10:50<3:37:16,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2476/10070 [1:10:50<3:37:16,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2477/10070 [1:10:52<3:37:16,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2477/10070 [1:10:52<3:37:16,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2478/10070 [1:10:53<3:37:12,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2478/10070 [1:10:53<3:37:12,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2479/10070 [1:10:54<3:37:08,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2479/10070 [1:10:54<3:37:08,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2480/10070 [1:10:55<3:37:04,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2480/10070 [1:10:55<3:37:04,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2481/10070 [1:10:57<3:37:03,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2481/10070 [1:10:57<3:37:03,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2482/10070 [1:10:58<3:36:59,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2482/10070 [1:10:58<3:36:59,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2483/10070 [1:10:59<3:36:56,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2483/10070 [1:10:59<3:36:56,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2484/10070 [1:11:02<3:36:56,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2484/10070 [1:11:02<3:36:56,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2485/10070 [1:11:02<3:36:51,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2485/10070 [1:11:02<3:36:51,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2486/10070 [1:11:04<3:36:48,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2486/10070 [1:11:04<3:36:48,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2487/10070 [1:11:06<3:36:48,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2487/10070 [1:11:06<3:36:48,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2488/10070 [1:11:08<3:36:48,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2488/10070 [1:11:08<3:36:48,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2489/10070 [1:11:09<3:36:43,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2489/10070 [1:11:09<3:36:43,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2490/10070 [1:11:10<3:36:41,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2490/10070 [1:11:10<3:36:41,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2491/10070 [1:11:12<3:36:39,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2491/10070 [1:11:12<3:36:39,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2492/10070 [1:11:13<3:36:36,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2492/10070 [1:11:13<3:36:36,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2493/10070 [1:11:15<3:36:34,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2493/10070 [1:11:15<3:36:34,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2494/10070 [1:11:16<3:36:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2494/10070 [1:11:16<3:36:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2495/10070 [1:11:16<3:36:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2495/10070 [1:11:16<3:36:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2496/10070 [1:11:32<3:37:06,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2496/10070 [1:11:32<3:37:06,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2497/10070 [1:11:35<3:37:06,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2497/10070 [1:11:35<3:37:06,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2498/10070 [1:11:36<3:37:04,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2498/10070 [1:11:36<3:37:04,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2499/10070 [1:11:37<3:37:00,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2499/10070 [1:11:37<3:37:00,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2500/10070 [1:11:38<3:36:56,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2500/10070 [1:11:38<3:36:56,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2501/10070 [1:11:39<3:36:51,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2501/10070 [1:11:39<3:36:51,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2502/10070 [1:11:40<3:36:48,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2502/10070 [1:11:40<3:36:48,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2503/10070 [1:11:42<3:36:48,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2503/10070 [1:11:42<3:36:48,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2504/10070 [1:11:45<3:36:48,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2504/10070 [1:11:45<3:36:48,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2505/10070 [1:11:46<3:36:45,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2505/10070 [1:11:46<3:36:45,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2506/10070 [1:11:48<3:36:45,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2506/10070 [1:11:48<3:36:45,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2507/10070 [1:11:50<3:36:43,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2507/10070 [1:11:50<3:36:43,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2508/10070 [1:11:52<3:36:41,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2508/10070 [1:11:52<3:36:41,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2509/10070 [1:11:52<3:36:37,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2509/10070 [1:11:52<3:36:37,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2510/10070 [1:11:54<3:36:33,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2510/10070 [1:11:54<3:36:33,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2511/10070 [1:11:55<3:36:30,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2511/10070 [1:11:55<3:36:30,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2512/10070 [1:11:56<3:36:25,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2512/10070 [1:11:56<3:36:25,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2513/10070 [1:11:57<3:36:22,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2513/10070 [1:11:57<3:36:22,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2514/10070 [1:11:59<3:36:22,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2514/10070 [1:11:59<3:36:22,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2515/10070 [1:12:01<3:36:22,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2515/10070 [1:12:01<3:36:22,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2516/10070 [1:12:03<3:36:20,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2516/10070 [1:12:03<3:36:20,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▏| 2517/10070 [1:12:04<3:36:16,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▏| 2517/10070 [1:12:04<3:36:16,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2518/10070 [1:12:04<3:36:11,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2518/10070 [1:12:04<3:36:11,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2519/10070 [1:12:06<3:36:09,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2519/10070 [1:12:06<3:36:09,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2520/10070 [1:12:08<3:36:09,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2520/10070 [1:12:08<3:36:09,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2521/10070 [1:12:11<3:36:09,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2521/10070 [1:12:11<3:36:09,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2522/10070 [1:12:11<3:36:04,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2522/10070 [1:12:11<3:36:04,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2523/10070 [1:12:12<3:35:59,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2523/10070 [1:12:12<3:35:59,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2524/10070 [1:12:14<3:35:59,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2524/10070 [1:12:14<3:35:59,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2525/10070 [1:12:16<3:35:57,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2525/10070 [1:12:16<3:35:57,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2526/10070 [1:12:17<3:35:52,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2526/10070 [1:12:17<3:35:52,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2527/10070 [1:12:19<3:35:52,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2527/10070 [1:12:19<3:35:52,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2528/10070 [1:12:26<3:36:06,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2528/10070 [1:12:26<3:36:06,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2529/10070 [1:12:27<3:36:03,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2529/10070 [1:12:27<3:36:03,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2530/10070 [1:12:28<3:35:58,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2530/10070 [1:12:28<3:35:58,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2531/10070 [1:12:28<3:35:53,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2531/10070 [1:12:28<3:35:53,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2532/10070 [1:12:29<3:35:49,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2532/10070 [1:12:29<3:35:49,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2533/10070 [1:12:31<3:35:47,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2533/10070 [1:12:31<3:35:47,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2534/10070 [1:12:32<3:35:42,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2534/10070 [1:12:32<3:35:42,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2535/10070 [1:12:33<3:35:39,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2535/10070 [1:12:33<3:35:39,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2536/10070 [1:12:34<3:35:37,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2536/10070 [1:12:34<3:35:37,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2537/10070 [1:12:35<3:35:32,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2537/10070 [1:12:35<3:35:32,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2538/10070 [1:12:37<3:35:31,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2538/10070 [1:12:37<3:35:31,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2539/10070 [1:12:38<3:35:26,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2539/10070 [1:12:38<3:35:26,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2540/10070 [1:12:40<3:35:26,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2540/10070 [1:12:40<3:35:26,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2541/10070 [1:12:40<3:35:21,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2541/10070 [1:12:40<3:35:21,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2542/10070 [1:12:43<3:35:21,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2542/10070 [1:12:43<3:35:21,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2543/10070 [1:12:43<3:35:16,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2543/10070 [1:12:43<3:35:16,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2544/10070 [1:12:44<3:35:12,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2544/10070 [1:12:44<3:35:12,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2545/10070 [1:12:45<3:35:07,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2545/10070 [1:12:45<3:35:07,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2546/10070 [1:12:47<3:35:07,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2546/10070 [1:12:47<3:35:07,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2547/10070 [1:12:48<3:35:02,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2547/10070 [1:12:48<3:35:02,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2548/10070 [1:12:49<3:34:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2548/10070 [1:12:49<3:34:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2549/10070 [1:12:50<3:34:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2549/10070 [1:12:50<3:34:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2550/10070 [1:12:51<3:34:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2550/10070 [1:12:51<3:34:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2551/10070 [1:12:53<3:34:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2551/10070 [1:12:53<3:34:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2552/10070 [1:12:53<3:34:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2552/10070 [1:12:53<3:34:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2553/10070 [1:12:56<3:34:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2553/10070 [1:12:56<3:34:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2554/10070 [1:12:57<3:34:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2554/10070 [1:12:57<3:34:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2555/10070 [1:12:57<3:34:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2555/10070 [1:12:57<3:34:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2556/10070 [1:12:58<3:34:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2556/10070 [1:12:58<3:34:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2557/10070 [1:13:00<3:34:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2557/10070 [1:13:00<3:34:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2558/10070 [1:13:01<3:34:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2558/10070 [1:13:01<3:34:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2559/10070 [1:13:02<3:34:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2559/10070 [1:13:02<3:34:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2560/10070 [1:13:17<3:34:59,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2560/10070 [1:13:17<3:34:59,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2561/10070 [1:13:17<3:34:54,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2561/10070 [1:13:17<3:34:55,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2562/10070 [1:13:18<3:34:50,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2562/10070 [1:13:18<3:34:50,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2563/10070 [1:13:20<3:34:48,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2563/10070 [1:13:20<3:34:48,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2564/10070 [1:13:21<3:34:43,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2564/10070 [1:13:21<3:34:43,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2565/10070 [1:13:23<3:34:43,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2565/10070 [1:13:23<3:34:43,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2566/10070 [1:13:25<3:34:43,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2566/10070 [1:13:25<3:34:43,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  25%|▎| 2567/10070 [1:13:27<3:34:43,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  25%|▎| 2567/10070 [1:13:27<3:34:43,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2568/10070 [1:13:28<3:34:39,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2568/10070 [1:13:28<3:34:39,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2569/10070 [1:13:29<3:34:35,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2569/10070 [1:13:29<3:34:35,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2570/10070 [1:13:32<3:34:35,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2570/10070 [1:13:32<3:34:35,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2571/10070 [1:13:33<3:34:34,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2571/10070 [1:13:33<3:34:34,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2572/10070 [1:13:35<3:34:32,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2572/10070 [1:13:35<3:34:32,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2573/10070 [1:13:37<3:34:30,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2573/10070 [1:13:37<3:34:30,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2574/10070 [1:13:39<3:34:29,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2574/10070 [1:13:39<3:34:29,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2575/10070 [1:13:40<3:34:25,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2575/10070 [1:13:40<3:34:25,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2576/10070 [1:13:41<3:34:22,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2576/10070 [1:13:41<3:34:22,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2577/10070 [1:13:42<3:34:19,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2577/10070 [1:13:42<3:34:19,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2578/10070 [1:13:43<3:34:14,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2578/10070 [1:13:43<3:34:14,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2579/10070 [1:13:44<3:34:10,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2579/10070 [1:13:44<3:34:10,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2580/10070 [1:13:44<3:34:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2580/10070 [1:13:44<3:34:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2581/10070 [1:13:45<3:34:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2581/10070 [1:13:45<3:34:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2582/10070 [1:13:47<3:33:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2582/10070 [1:13:47<3:33:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2583/10070 [1:13:47<3:33:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2583/10070 [1:13:47<3:33:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2584/10070 [1:13:48<3:33:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2584/10070 [1:13:48<3:33:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2585/10070 [1:13:50<3:33:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2585/10070 [1:13:50<3:33:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2586/10070 [1:13:52<3:33:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2586/10070 [1:13:52<3:33:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2587/10070 [1:13:54<3:33:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2587/10070 [1:13:54<3:33:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2588/10070 [1:13:55<3:33:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2588/10070 [1:13:55<3:33:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2589/10070 [1:13:56<3:33:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2589/10070 [1:13:56<3:33:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2590/10070 [1:13:57<3:33:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2590/10070 [1:13:57<3:33:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2591/10070 [1:13:57<3:33:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2591/10070 [1:13:57<3:33:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2592/10070 [1:14:10<3:34:00,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2592/10070 [1:14:10<3:34:00,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2593/10070 [1:14:12<3:33:59,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2593/10070 [1:14:12<3:33:59,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2594/10070 [1:14:13<3:33:54,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2594/10070 [1:14:13<3:33:54,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2595/10070 [1:14:14<3:33:51,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2595/10070 [1:14:14<3:33:51,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2596/10070 [1:14:15<3:33:47,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2596/10070 [1:14:15<3:33:47,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2597/10070 [1:14:17<3:33:46,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2597/10070 [1:14:17<3:33:46,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2598/10070 [1:14:18<3:33:43,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2598/10070 [1:14:18<3:33:43,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2599/10070 [1:14:20<3:33:43,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2599/10070 [1:14:20<3:33:43,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2600/10070 [1:14:21<3:33:38,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2600/10070 [1:14:21<3:33:38,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2601/10070 [1:14:22<3:33:35,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2601/10070 [1:14:22<3:33:35,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2602/10070 [1:14:24<3:33:32,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2602/10070 [1:14:24<3:33:32,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2603/10070 [1:14:25<3:33:29,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2603/10070 [1:14:25<3:33:29,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2604/10070 [1:14:27<3:33:27,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2604/10070 [1:14:27<3:33:27,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2605/10070 [1:14:29<3:33:27,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2605/10070 [1:14:29<3:33:27,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2606/10070 [1:14:30<3:33:22,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2606/10070 [1:14:30<3:33:22,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2607/10070 [1:14:31<3:33:19,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2607/10070 [1:14:31<3:33:19,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2608/10070 [1:14:33<3:33:19,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2608/10070 [1:14:33<3:33:19,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2609/10070 [1:14:34<3:33:16,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2609/10070 [1:14:34<3:33:16,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2610/10070 [1:14:35<3:33:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2610/10070 [1:14:35<3:33:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2611/10070 [1:14:36<3:33:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2611/10070 [1:14:36<3:33:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2612/10070 [1:14:37<3:33:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2612/10070 [1:14:37<3:33:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2613/10070 [1:14:39<3:33:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2613/10070 [1:14:39<3:33:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2614/10070 [1:14:40<3:33:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2614/10070 [1:14:40<3:33:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2615/10070 [1:14:42<3:32:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2615/10070 [1:14:42<3:32:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2616/10070 [1:14:43<3:32:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2616/10070 [1:14:43<3:32:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2617/10070 [1:14:44<3:32:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2617/10070 [1:14:44<3:32:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2618/10070 [1:14:46<3:32:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2618/10070 [1:14:46<3:32:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2619/10070 [1:14:47<3:32:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2619/10070 [1:14:47<3:32:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2620/10070 [1:14:48<3:32:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2620/10070 [1:14:48<3:32:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2621/10070 [1:14:49<3:32:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2621/10070 [1:14:49<3:32:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2622/10070 [1:14:50<3:32:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2622/10070 [1:14:50<3:32:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2623/10070 [1:14:51<3:32:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2623/10070 [1:14:51<3:32:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2624/10070 [1:14:59<3:32:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2624/10070 [1:14:59<3:32:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2625/10070 [1:15:01<3:32:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2625/10070 [1:15:01<3:32:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2626/10070 [1:15:03<3:32:47,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2626/10070 [1:15:03<3:32:47,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2627/10070 [1:15:04<3:32:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2627/10070 [1:15:04<3:32:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2628/10070 [1:15:05<3:32:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2628/10070 [1:15:05<3:32:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2629/10070 [1:15:07<3:32:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2629/10070 [1:15:07<3:32:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2630/10070 [1:15:08<3:32:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2630/10070 [1:15:08<3:32:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2631/10070 [1:15:08<3:32:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2631/10070 [1:15:08<3:32:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2632/10070 [1:15:09<3:32:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2632/10070 [1:15:09<3:32:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2633/10070 [1:15:11<3:32:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2633/10070 [1:15:11<3:32:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2634/10070 [1:15:13<3:32:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2634/10070 [1:15:13<3:32:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2635/10070 [1:15:15<3:32:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2635/10070 [1:15:15<3:32:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2636/10070 [1:15:15<3:32:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2636/10070 [1:15:15<3:32:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2637/10070 [1:15:17<3:32:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2637/10070 [1:15:17<3:32:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2638/10070 [1:15:18<3:32:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2638/10070 [1:15:18<3:32:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2639/10070 [1:15:20<3:32:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2639/10070 [1:15:20<3:32:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2640/10070 [1:15:21<3:32:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2640/10070 [1:15:21<3:32:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2641/10070 [1:15:23<3:32:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2641/10070 [1:15:23<3:32:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2642/10070 [1:15:23<3:31:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2642/10070 [1:15:23<3:31:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2643/10070 [1:15:24<3:31:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2643/10070 [1:15:24<3:31:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2644/10070 [1:15:25<3:31:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2644/10070 [1:15:25<3:31:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2645/10070 [1:15:26<3:31:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2645/10070 [1:15:26<3:31:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2646/10070 [1:15:27<3:31:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2646/10070 [1:15:27<3:31:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2647/10070 [1:15:29<3:31:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2647/10070 [1:15:29<3:31:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2648/10070 [1:15:30<3:31:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2648/10070 [1:15:30<3:31:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2649/10070 [1:15:31<3:31:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2649/10070 [1:15:31<3:31:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2650/10070 [1:15:34<3:31:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2650/10070 [1:15:34<3:31:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2651/10070 [1:15:36<3:31:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2651/10070 [1:15:36<3:31:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2652/10070 [1:15:38<3:31:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2652/10070 [1:15:38<3:31:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2653/10070 [1:15:40<3:31:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2653/10070 [1:15:40<3:31:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2654/10070 [1:15:42<3:31:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2654/10070 [1:15:42<3:31:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2655/10070 [1:15:43<3:31:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2655/10070 [1:15:43<3:31:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2656/10070 [1:15:51<3:31:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2656/10070 [1:15:51<3:31:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2657/10070 [1:15:51<3:31:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2657/10070 [1:15:51<3:31:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2658/10070 [1:15:53<3:31:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2658/10070 [1:15:53<3:31:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2659/10070 [1:15:54<3:31:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2659/10070 [1:15:54<3:31:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2660/10070 [1:15:56<3:31:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2660/10070 [1:15:56<3:31:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2661/10070 [1:15:57<3:31:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2661/10070 [1:15:57<3:31:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2662/10070 [1:15:58<3:31:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2662/10070 [1:15:58<3:31:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2663/10070 [1:16:00<3:31:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2663/10070 [1:16:00<3:31:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2664/10070 [1:16:02<3:31:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2664/10070 [1:16:02<3:31:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2665/10070 [1:16:05<3:31:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2665/10070 [1:16:05<3:31:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2666/10070 [1:16:05<3:31:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2666/10070 [1:16:05<3:31:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2667/10070 [1:16:08<3:31:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2667/10070 [1:16:08<3:31:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  26%|▎| 2668/10070 [1:16:08<3:31:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  26%|▎| 2668/10070 [1:16:08<3:31:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2669/10070 [1:16:10<3:31:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2669/10070 [1:16:10<3:31:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2670/10070 [1:16:11<3:31:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2670/10070 [1:16:11<3:31:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2671/10070 [1:16:13<3:31:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2671/10070 [1:16:13<3:31:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2672/10070 [1:16:16<3:31:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2672/10070 [1:16:16<3:31:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2673/10070 [1:16:16<3:31:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2673/10070 [1:16:16<3:31:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2674/10070 [1:16:18<3:31:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2674/10070 [1:16:18<3:31:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2675/10070 [1:16:19<3:30:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2675/10070 [1:16:19<3:30:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2676/10070 [1:16:20<3:30:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2676/10070 [1:16:20<3:30:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2677/10070 [1:16:20<3:30:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2677/10070 [1:16:20<3:30:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2678/10070 [1:16:23<3:30:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2678/10070 [1:16:23<3:30:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2679/10070 [1:16:23<3:30:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2679/10070 [1:16:23<3:30:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2680/10070 [1:16:26<3:30:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2680/10070 [1:16:26<3:30:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2681/10070 [1:16:26<3:30:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2681/10070 [1:16:26<3:30:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2682/10070 [1:16:27<3:30:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2682/10070 [1:16:27<3:30:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2683/10070 [1:16:28<3:30:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2683/10070 [1:16:28<3:30:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2684/10070 [1:16:28<3:30:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2684/10070 [1:16:28<3:30:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2685/10070 [1:16:31<3:30:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2685/10070 [1:16:31<3:30:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2686/10070 [1:16:31<3:30:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2686/10070 [1:16:31<3:30:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2687/10070 [1:16:33<3:30:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2687/10070 [1:16:33<3:30:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2688/10070 [1:16:45<3:30:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2688/10070 [1:16:45<3:30:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2689/10070 [1:16:47<3:30:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2689/10070 [1:16:47<3:30:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2690/10070 [1:16:49<3:30:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2690/10070 [1:16:49<3:30:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2691/10070 [1:16:50<3:30:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2691/10070 [1:16:50<3:30:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2692/10070 [1:16:51<3:30:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2692/10070 [1:16:51<3:30:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2693/10070 [1:16:52<3:30:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2693/10070 [1:16:52<3:30:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2694/10070 [1:16:53<3:30:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2694/10070 [1:16:53<3:30:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2695/10070 [1:16:55<3:30:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2695/10070 [1:16:55<3:30:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2696/10070 [1:16:57<3:30:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2696/10070 [1:16:57<3:30:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2697/10070 [1:16:58<3:30:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2697/10070 [1:16:58<3:30:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2698/10070 [1:17:00<3:30:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2698/10070 [1:17:00<3:30:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2699/10070 [1:17:01<3:30:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2699/10070 [1:17:01<3:30:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2700/10070 [1:17:02<3:30:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2700/10070 [1:17:02<3:30:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2701/10070 [1:17:03<3:30:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2701/10070 [1:17:03<3:30:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2702/10070 [1:17:04<3:30:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2702/10070 [1:17:04<3:30:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2703/10070 [1:17:06<3:30:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2703/10070 [1:17:06<3:30:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2704/10070 [1:17:09<3:30:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2704/10070 [1:17:09<3:30:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2705/10070 [1:17:10<3:30:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2705/10070 [1:17:10<3:30:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2706/10070 [1:17:12<3:30:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2706/10070 [1:17:12<3:30:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2707/10070 [1:17:14<3:30:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2707/10070 [1:17:14<3:30:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2708/10070 [1:17:16<3:30:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2708/10070 [1:17:16<3:30:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2709/10070 [1:17:17<3:30:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2709/10070 [1:17:17<3:30:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2710/10070 [1:17:18<3:29:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2710/10070 [1:17:18<3:29:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2711/10070 [1:17:20<3:29:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2711/10070 [1:17:20<3:29:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2712/10070 [1:17:21<3:29:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2712/10070 [1:17:21<3:29:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2713/10070 [1:17:22<3:29:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2713/10070 [1:17:22<3:29:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2714/10070 [1:17:23<3:29:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2714/10070 [1:17:23<3:29:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2715/10070 [1:17:24<3:29:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2715/10070 [1:17:24<3:29:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2716/10070 [1:17:25<3:29:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2716/10070 [1:17:25<3:29:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2717/10070 [1:17:26<3:29:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2717/10070 [1:17:26<3:29:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2718/10070 [1:17:27<3:29:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2718/10070 [1:17:27<3:29:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2719/10070 [1:17:28<3:29:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2719/10070 [1:17:28<3:29:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2720/10070 [1:17:37<3:29:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2720/10070 [1:17:37<3:29:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2721/10070 [1:17:39<3:29:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2721/10070 [1:17:39<3:29:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2722/10070 [1:17:40<3:29:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2722/10070 [1:17:40<3:29:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2723/10070 [1:17:41<3:29:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2723/10070 [1:17:41<3:29:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2724/10070 [1:17:44<3:29:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2724/10070 [1:17:44<3:29:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2725/10070 [1:17:44<3:29:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2725/10070 [1:17:44<3:29:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2726/10070 [1:17:47<3:29:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2726/10070 [1:17:47<3:29:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2727/10070 [1:17:47<3:29:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2727/10070 [1:17:47<3:29:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2728/10070 [1:17:49<3:29:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2728/10070 [1:17:49<3:29:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2729/10070 [1:17:50<3:29:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2729/10070 [1:17:50<3:29:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2730/10070 [1:17:51<3:29:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2730/10070 [1:17:51<3:29:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2731/10070 [1:17:52<3:29:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2731/10070 [1:17:52<3:29:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2732/10070 [1:17:54<3:29:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2732/10070 [1:17:54<3:29:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2733/10070 [1:17:55<3:29:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2733/10070 [1:17:55<3:29:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2734/10070 [1:17:57<3:29:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2734/10070 [1:17:57<3:29:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2735/10070 [1:17:58<3:29:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2735/10070 [1:17:58<3:29:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2736/10070 [1:18:00<3:29:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2736/10070 [1:18:00<3:29:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2737/10070 [1:18:02<3:29:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2737/10070 [1:18:02<3:29:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2738/10070 [1:18:04<3:29:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2738/10070 [1:18:04<3:29:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2739/10070 [1:18:06<3:29:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2739/10070 [1:18:06<3:29:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2740/10070 [1:18:08<3:29:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2740/10070 [1:18:08<3:29:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2741/10070 [1:18:10<3:29:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2741/10070 [1:18:10<3:29:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2742/10070 [1:18:11<3:28:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2742/10070 [1:18:11<3:28:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2743/10070 [1:18:12<3:28:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2743/10070 [1:18:12<3:28:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2744/10070 [1:18:14<3:28:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2744/10070 [1:18:14<3:28:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2745/10070 [1:18:16<3:28:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2745/10070 [1:18:16<3:28:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2746/10070 [1:18:18<3:28:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2746/10070 [1:18:18<3:28:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2747/10070 [1:18:20<3:28:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2747/10070 [1:18:20<3:28:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2748/10070 [1:18:23<3:28:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2748/10070 [1:18:23<3:28:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2749/10070 [1:18:23<3:28:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2749/10070 [1:18:23<3:28:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2750/10070 [1:18:26<3:28:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2750/10070 [1:18:26<3:28:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2751/10070 [1:18:26<3:28:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2751/10070 [1:18:26<3:28:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2752/10070 [1:18:33<3:28:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2752/10070 [1:18:33<3:28:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2753/10070 [1:18:35<3:28:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2753/10070 [1:18:35<3:28:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2754/10070 [1:18:37<3:28:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2754/10070 [1:18:37<3:28:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2755/10070 [1:18:38<3:28:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2755/10070 [1:18:38<3:28:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2756/10070 [1:18:39<3:28:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2756/10070 [1:18:39<3:28:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2757/10070 [1:18:40<3:28:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2757/10070 [1:18:40<3:28:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2758/10070 [1:18:40<3:28:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2758/10070 [1:18:40<3:28:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2759/10070 [1:18:42<3:28:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2759/10070 [1:18:42<3:28:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2760/10070 [1:18:43<3:28:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2760/10070 [1:18:43<3:28:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2761/10070 [1:18:44<3:28:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2761/10070 [1:18:44<3:28:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2762/10070 [1:18:45<3:28:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2762/10070 [1:18:45<3:28:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2763/10070 [1:18:46<3:28:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2763/10070 [1:18:46<3:28:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2764/10070 [1:18:47<3:28:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2764/10070 [1:18:47<3:28:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2765/10070 [1:18:50<3:28:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2765/10070 [1:18:50<3:28:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2766/10070 [1:18:51<3:28:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2766/10070 [1:18:51<3:28:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2767/10070 [1:18:54<3:28:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2767/10070 [1:18:54<3:28:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2768/10070 [1:18:55<3:28:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2768/10070 [1:18:55<3:28:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  27%|▎| 2769/10070 [1:18:57<3:28:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  27%|▎| 2769/10070 [1:18:57<3:28:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2770/10070 [1:18:59<3:28:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2770/10070 [1:18:59<3:28:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2771/10070 [1:19:00<3:28:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2771/10070 [1:19:00<3:28:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2772/10070 [1:19:00<3:28:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2772/10070 [1:19:00<3:28:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2773/10070 [1:19:01<3:27:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2773/10070 [1:19:01<3:27:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2774/10070 [1:19:02<3:27:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2774/10070 [1:19:02<3:27:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2775/10070 [1:19:04<3:27:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2775/10070 [1:19:04<3:27:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2776/10070 [1:19:06<3:27:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2776/10070 [1:19:06<3:27:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2777/10070 [1:19:08<3:27:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2777/10070 [1:19:08<3:27:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2778/10070 [1:19:09<3:27:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2778/10070 [1:19:09<3:27:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2779/10070 [1:19:10<3:27:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2779/10070 [1:19:10<3:27:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2780/10070 [1:19:12<3:27:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2780/10070 [1:19:12<3:27:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2781/10070 [1:19:13<3:27:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2781/10070 [1:19:13<3:27:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2782/10070 [1:19:13<3:27:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2782/10070 [1:19:13<3:27:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2783/10070 [1:19:14<3:27:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2783/10070 [1:19:14<3:27:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2784/10070 [1:19:28<3:27:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2784/10070 [1:19:28<3:27:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2785/10070 [1:19:28<3:27:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2785/10070 [1:19:28<3:27:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2786/10070 [1:19:30<3:27:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2786/10070 [1:19:30<3:27:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2787/10070 [1:19:30<3:27:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2787/10070 [1:19:30<3:27:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2788/10070 [1:19:32<3:27:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2788/10070 [1:19:32<3:27:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2789/10070 [1:19:35<3:27:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2789/10070 [1:19:35<3:27:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2790/10070 [1:19:36<3:27:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2790/10070 [1:19:36<3:27:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2791/10070 [1:19:36<3:27:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2791/10070 [1:19:36<3:27:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2792/10070 [1:19:39<3:27:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2792/10070 [1:19:39<3:27:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2793/10070 [1:19:40<3:27:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2793/10070 [1:19:40<3:27:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2794/10070 [1:19:41<3:27:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2794/10070 [1:19:41<3:27:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2795/10070 [1:19:42<3:27:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2795/10070 [1:19:42<3:27:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2796/10070 [1:19:43<3:27:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2796/10070 [1:19:43<3:27:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2797/10070 [1:19:45<3:27:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2797/10070 [1:19:45<3:27:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2798/10070 [1:19:46<3:27:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2798/10070 [1:19:46<3:27:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2799/10070 [1:19:47<3:27:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2799/10070 [1:19:47<3:27:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2800/10070 [1:19:49<3:27:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2800/10070 [1:19:49<3:27:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2801/10070 [1:19:51<3:27:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2801/10070 [1:19:51<3:27:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2802/10070 [1:19:53<3:27:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2802/10070 [1:19:53<3:27:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2803/10070 [1:19:55<3:27:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2803/10070 [1:19:55<3:27:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2804/10070 [1:19:56<3:27:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2804/10070 [1:19:56<3:27:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2805/10070 [1:19:58<3:27:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2805/10070 [1:19:58<3:27:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2806/10070 [1:19:59<3:27:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2806/10070 [1:19:59<3:27:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2807/10070 [1:20:01<3:27:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2807/10070 [1:20:01<3:27:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2808/10070 [1:20:02<3:26:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2808/10070 [1:20:02<3:26:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2809/10070 [1:20:04<3:26:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2809/10070 [1:20:04<3:26:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2810/10070 [1:20:06<3:26:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2810/10070 [1:20:06<3:26:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2811/10070 [1:20:07<3:26:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2811/10070 [1:20:07<3:26:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2812/10070 [1:20:08<3:26:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2812/10070 [1:20:08<3:26:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2813/10070 [1:20:10<3:26:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2813/10070 [1:20:10<3:26:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2814/10070 [1:20:11<3:26:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2814/10070 [1:20:11<3:26:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2815/10070 [1:20:11<3:26:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2815/10070 [1:20:11<3:26:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2816/10070 [1:20:22<3:27:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2816/10070 [1:20:22<3:27:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2817/10070 [1:20:24<3:27:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2817/10070 [1:20:24<3:27:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2818/10070 [1:20:26<3:27:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2818/10070 [1:20:26<3:27:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2819/10070 [1:20:27<3:26:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2819/10070 [1:20:27<3:26:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2820/10070 [1:20:29<3:26:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2820/10070 [1:20:29<3:26:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2821/10070 [1:20:30<3:26:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2821/10070 [1:20:30<3:26:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2822/10070 [1:20:32<3:26:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2822/10070 [1:20:32<3:26:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2823/10070 [1:20:34<3:26:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2823/10070 [1:20:34<3:26:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2824/10070 [1:20:35<3:26:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2824/10070 [1:20:35<3:26:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2825/10070 [1:20:36<3:26:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2825/10070 [1:20:36<3:26:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2826/10070 [1:20:37<3:26:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2826/10070 [1:20:37<3:26:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2827/10070 [1:20:37<3:26:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2827/10070 [1:20:37<3:26:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2828/10070 [1:20:39<3:26:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2828/10070 [1:20:39<3:26:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2829/10070 [1:20:41<3:26:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2829/10070 [1:20:41<3:26:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|��| 2830/10070 [1:20:42<3:26:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2830/10070 [1:20:42<3:26:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2831/10070 [1:20:43<3:26:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2831/10070 [1:20:43<3:26:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2832/10070 [1:20:46<3:26:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2832/10070 [1:20:46<3:26:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2833/10070 [1:20:47<3:26:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2833/10070 [1:20:47<3:26:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2834/10070 [1:20:48<3:26:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2834/10070 [1:20:48<3:26:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2835/10070 [1:20:49<3:26:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2835/10070 [1:20:49<3:26:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2836/10070 [1:20:50<3:26:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2836/10070 [1:20:50<3:26:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2837/10070 [1:20:52<3:26:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2837/10070 [1:20:52<3:26:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2838/10070 [1:20:54<3:26:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2838/10070 [1:20:54<3:26:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2839/10070 [1:20:55<3:26:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2839/10070 [1:20:55<3:26:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2840/10070 [1:20:56<3:26:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2840/10070 [1:20:56<3:26:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2841/10070 [1:20:58<3:26:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2841/10070 [1:20:58<3:26:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2842/10070 [1:21:00<3:26:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2842/10070 [1:21:00<3:26:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2843/10070 [1:21:00<3:25:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2843/10070 [1:21:00<3:25:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2844/10070 [1:21:02<3:25:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2844/10070 [1:21:02<3:25:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2845/10070 [1:21:03<3:25:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2845/10070 [1:21:03<3:25:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2846/10070 [1:21:04<3:25:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2846/10070 [1:21:04<3:25:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2847/10070 [1:21:06<3:25:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2847/10070 [1:21:06<3:25:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2848/10070 [1:21:16<3:26:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2848/10070 [1:21:16<3:26:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2849/10070 [1:21:16<3:26:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2849/10070 [1:21:16<3:26:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2850/10070 [1:21:18<3:25:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2850/10070 [1:21:18<3:25:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2851/10070 [1:21:19<3:25:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2851/10070 [1:21:19<3:25:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2852/10070 [1:21:21<3:25:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2852/10070 [1:21:21<3:25:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2853/10070 [1:21:24<3:25:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2853/10070 [1:21:24<3:25:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2854/10070 [1:21:26<3:25:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2854/10070 [1:21:26<3:25:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2855/10070 [1:21:27<3:25:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2855/10070 [1:21:27<3:25:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2856/10070 [1:21:28<3:25:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2856/10070 [1:21:28<3:25:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2857/10070 [1:21:29<3:25:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2857/10070 [1:21:29<3:25:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2858/10070 [1:21:31<3:25:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2858/10070 [1:21:31<3:25:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2859/10070 [1:21:33<3:25:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2859/10070 [1:21:33<3:25:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2860/10070 [1:21:34<3:25:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2860/10070 [1:21:34<3:25:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2861/10070 [1:21:35<3:25:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2861/10070 [1:21:35<3:25:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2862/10070 [1:21:36<3:25:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2862/10070 [1:21:36<3:25:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2863/10070 [1:21:37<3:25:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2863/10070 [1:21:37<3:25:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2864/10070 [1:21:39<3:25:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2864/10070 [1:21:39<3:25:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2865/10070 [1:21:41<3:25:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2865/10070 [1:21:41<3:25:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2866/10070 [1:21:42<3:25:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2866/10070 [1:21:42<3:25:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2867/10070 [1:21:43<3:25:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2867/10070 [1:21:43<3:25:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2868/10070 [1:21:44<3:25:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2868/10070 [1:21:44<3:25:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  28%|▎| 2869/10070 [1:21:45<3:25:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  28%|▎| 2869/10070 [1:21:45<3:25:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2870/10070 [1:21:46<3:25:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2870/10070 [1:21:46<3:25:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2871/10070 [1:21:46<3:25:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2871/10070 [1:21:46<3:25:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2872/10070 [1:21:48<3:25:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2872/10070 [1:21:48<3:25:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2873/10070 [1:21:50<3:25:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2873/10070 [1:21:50<3:25:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2874/10070 [1:21:52<3:24:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2874/10070 [1:21:52<3:24:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2875/10070 [1:21:52<3:24:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2875/10070 [1:21:52<3:24:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2876/10070 [1:21:54<3:24:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2876/10070 [1:21:54<3:24:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2877/10070 [1:21:56<3:24:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2877/10070 [1:21:56<3:24:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2878/10070 [1:21:58<3:24:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2878/10070 [1:21:58<3:24:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2879/10070 [1:21:59<3:24:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2879/10070 [1:21:59<3:24:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2880/10070 [1:22:10<3:25:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2880/10070 [1:22:10<3:25:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2881/10070 [1:22:11<3:25:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2881/10070 [1:22:11<3:25:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2882/10070 [1:22:12<3:25:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2882/10070 [1:22:12<3:25:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2883/10070 [1:22:14<3:25:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2883/10070 [1:22:14<3:25:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2884/10070 [1:22:15<3:24:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2884/10070 [1:22:15<3:24:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2885/10070 [1:22:17<3:24:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2885/10070 [1:22:17<3:24:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2886/10070 [1:22:19<3:24:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2886/10070 [1:22:19<3:24:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2887/10070 [1:22:20<3:24:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2887/10070 [1:22:20<3:24:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2888/10070 [1:22:21<3:24:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2888/10070 [1:22:21<3:24:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2889/10070 [1:22:22<3:24:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2889/10070 [1:22:22<3:24:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2890/10070 [1:22:23<3:24:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2890/10070 [1:22:23<3:24:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2891/10070 [1:22:24<3:24:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2891/10070 [1:22:24<3:24:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2892/10070 [1:22:25<3:24:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2892/10070 [1:22:25<3:24:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2893/10070 [1:22:27<3:24:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2893/10070 [1:22:27<3:24:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2894/10070 [1:22:28<3:24:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2894/10070 [1:22:28<3:24:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2895/10070 [1:22:29<3:24:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2895/10070 [1:22:29<3:24:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2896/10070 [1:22:29<3:24:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2896/10070 [1:22:29<3:24:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2897/10070 [1:22:31<3:24:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2897/10070 [1:22:31<3:24:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2898/10070 [1:22:33<3:24:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2898/10070 [1:22:33<3:24:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2899/10070 [1:22:35<3:24:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2899/10070 [1:22:35<3:24:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2900/10070 [1:22:37<3:24:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2900/10070 [1:22:37<3:24:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2901/10070 [1:22:39<3:24:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2901/10070 [1:22:39<3:24:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2902/10070 [1:22:41<3:24:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2902/10070 [1:22:41<3:24:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2903/10070 [1:22:42<3:24:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2903/10070 [1:22:42<3:24:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2904/10070 [1:22:44<3:24:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2904/10070 [1:22:44<3:24:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2905/10070 [1:22:45<3:24:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2905/10070 [1:22:45<3:24:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2906/10070 [1:22:46<3:24:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2906/10070 [1:22:46<3:24:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2907/10070 [1:22:48<3:24:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2907/10070 [1:22:48<3:24:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2908/10070 [1:22:49<3:24:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2908/10070 [1:22:49<3:24:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2909/10070 [1:22:50<3:23:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2909/10070 [1:22:50<3:23:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2910/10070 [1:22:51<3:23:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2910/10070 [1:22:51<3:23:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2911/10070 [1:22:51<3:23:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2911/10070 [1:22:51<3:23:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2912/10070 [1:23:04<3:24:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2912/10070 [1:23:04<3:24:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2913/10070 [1:23:06<3:24:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2913/10070 [1:23:06<3:24:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2914/10070 [1:23:07<3:24:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2914/10070 [1:23:07<3:24:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2915/10070 [1:23:09<3:24:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2915/10070 [1:23:09<3:24:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2916/10070 [1:23:09<3:24:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2916/10070 [1:23:09<3:24:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2917/10070 [1:23:11<3:23:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2917/10070 [1:23:11<3:23:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2918/10070 [1:23:11<3:23:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2918/10070 [1:23:11<3:23:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2919/10070 [1:23:13<3:23:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2919/10070 [1:23:13<3:23:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2920/10070 [1:23:14<3:23:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2920/10070 [1:23:14<3:23:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2921/10070 [1:23:16<3:23:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2921/10070 [1:23:16<3:23:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2922/10070 [1:23:17<3:23:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2922/10070 [1:23:17<3:23:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2923/10070 [1:23:18<3:23:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2923/10070 [1:23:18<3:23:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2924/10070 [1:23:19<3:23:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2924/10070 [1:23:19<3:23:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2925/10070 [1:23:20<3:23:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2925/10070 [1:23:20<3:23:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2926/10070 [1:23:21<3:23:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2926/10070 [1:23:21<3:23:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2927/10070 [1:23:23<3:23:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2927/10070 [1:23:23<3:23:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2928/10070 [1:23:25<3:23:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2928/10070 [1:23:25<3:23:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2929/10070 [1:23:26<3:23:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2929/10070 [1:23:26<3:23:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2930/10070 [1:23:28<3:23:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2930/10070 [1:23:28<3:23:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2931/10070 [1:23:29<3:23:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2931/10070 [1:23:29<3:23:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2932/10070 [1:23:31<3:23:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2932/10070 [1:23:31<3:23:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2933/10070 [1:23:32<3:23:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2933/10070 [1:23:32<3:23:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2934/10070 [1:23:32<3:23:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2934/10070 [1:23:32<3:23:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2935/10070 [1:23:34<3:23:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2935/10070 [1:23:34<3:23:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2936/10070 [1:23:35<3:23:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2936/10070 [1:23:35<3:23:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2937/10070 [1:23:37<3:23:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2937/10070 [1:23:37<3:23:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2938/10070 [1:23:38<3:23:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2938/10070 [1:23:38<3:23:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2939/10070 [1:23:40<3:23:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2939/10070 [1:23:40<3:23:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2940/10070 [1:23:41<3:22:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2940/10070 [1:23:41<3:22:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2941/10070 [1:23:43<3:22:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2941/10070 [1:23:43<3:22:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2942/10070 [1:23:44<3:22:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2942/10070 [1:23:44<3:22:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2943/10070 [1:23:44<3:22:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2943/10070 [1:23:44<3:22:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2944/10070 [1:23:55<3:23:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2944/10070 [1:23:55<3:23:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2945/10070 [1:23:56<3:23:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2945/10070 [1:23:56<3:23:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2946/10070 [1:23:57<3:23:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2946/10070 [1:23:57<3:23:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2947/10070 [1:23:58<3:22:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2947/10070 [1:23:58<3:22:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2948/10070 [1:23:59<3:22:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2948/10070 [1:23:59<3:22:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2949/10070 [1:23:59<3:22:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2949/10070 [1:23:59<3:22:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2950/10070 [1:24:00<3:22:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2950/10070 [1:24:00<3:22:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2951/10070 [1:24:01<3:22:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2951/10070 [1:24:01<3:22:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2952/10070 [1:24:03<3:22:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2952/10070 [1:24:03<3:22:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2953/10070 [1:24:05<3:22:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2953/10070 [1:24:05<3:22:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2954/10070 [1:24:06<3:22:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2954/10070 [1:24:06<3:22:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2955/10070 [1:24:07<3:22:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2955/10070 [1:24:07<3:22:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2956/10070 [1:24:09<3:22:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2956/10070 [1:24:09<3:22:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2957/10070 [1:24:10<3:22:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2957/10070 [1:24:10<3:22:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2958/10070 [1:24:11<3:22:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2958/10070 [1:24:11<3:22:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2959/10070 [1:24:12<3:22:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2959/10070 [1:24:12<3:22:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2960/10070 [1:24:14<3:22:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2960/10070 [1:24:14<3:22:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2961/10070 [1:24:16<3:22:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2961/10070 [1:24:16<3:22:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2962/10070 [1:24:17<3:22:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2962/10070 [1:24:17<3:22:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2963/10070 [1:24:18<3:22:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2963/10070 [1:24:18<3:22:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2964/10070 [1:24:19<3:22:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2964/10070 [1:24:19<3:22:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2965/10070 [1:24:21<3:22:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2965/10070 [1:24:21<3:22:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2966/10070 [1:24:23<3:22:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2966/10070 [1:24:23<3:22:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2967/10070 [1:24:24<3:22:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2967/10070 [1:24:24<3:22:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2968/10070 [1:24:26<3:22:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2968/10070 [1:24:26<3:22:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2969/10070 [1:24:27<3:22:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2969/10070 [1:24:27<3:22:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  29%|▎| 2970/10070 [1:24:29<3:21:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  29%|▎| 2970/10070 [1:24:29<3:21:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2971/10070 [1:24:30<3:21:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2971/10070 [1:24:30<3:21:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2972/10070 [1:24:32<3:21:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2972/10070 [1:24:32<3:21:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2973/10070 [1:24:34<3:21:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2973/10070 [1:24:34<3:21:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2974/10070 [1:24:35<3:21:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2974/10070 [1:24:35<3:21:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2975/10070 [1:24:36<3:21:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2975/10070 [1:24:36<3:21:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2976/10070 [1:24:53<3:22:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2976/10070 [1:24:53<3:22:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2977/10070 [1:24:54<3:22:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2977/10070 [1:24:54<3:22:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2978/10070 [1:24:56<3:22:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2978/10070 [1:24:56<3:22:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2979/10070 [1:24:57<3:22:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2979/10070 [1:24:57<3:22:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2980/10070 [1:24:58<3:22:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2980/10070 [1:24:58<3:22:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2981/10070 [1:24:59<3:22:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2981/10070 [1:24:59<3:22:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2982/10070 [1:25:01<3:22:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2982/10070 [1:25:01<3:22:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2983/10070 [1:25:02<3:22:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2983/10070 [1:25:02<3:22:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2984/10070 [1:25:03<3:22:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2984/10070 [1:25:03<3:22:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2985/10070 [1:25:05<3:21:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2985/10070 [1:25:05<3:21:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2986/10070 [1:25:07<3:21:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2986/10070 [1:25:07<3:21:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2987/10070 [1:25:08<3:21:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2987/10070 [1:25:08<3:21:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2988/10070 [1:25:09<3:21:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2988/10070 [1:25:09<3:21:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2989/10070 [1:25:11<3:21:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2989/10070 [1:25:11<3:21:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2990/10070 [1:25:12<3:21:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2990/10070 [1:25:12<3:21:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2991/10070 [1:25:13<3:21:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2991/10070 [1:25:13<3:21:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2992/10070 [1:25:14<3:21:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2992/10070 [1:25:14<3:21:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2993/10070 [1:25:16<3:21:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2993/10070 [1:25:16<3:21:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2994/10070 [1:25:19<3:21:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2994/10070 [1:25:19<3:21:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2995/10070 [1:25:20<3:21:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2995/10070 [1:25:20<3:21:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2996/10070 [1:25:22<3:21:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2996/10070 [1:25:22<3:21:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2997/10070 [1:25:23<3:21:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2997/10070 [1:25:23<3:21:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2998/10070 [1:25:26<3:21:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2998/10070 [1:25:26<3:21:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 2999/10070 [1:25:26<3:21:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 2999/10070 [1:25:26<3:21:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3000/10070 [1:25:29<3:21:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3000/10070 [1:25:29<3:21:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3001/10070 [1:25:29<3:21:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3001/10070 [1:25:29<3:21:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3002/10070 [1:25:32<3:21:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3002/10070 [1:25:32<3:21:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3003/10070 [1:25:34<3:21:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3003/10070 [1:25:34<3:21:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3004/10070 [1:25:36<3:21:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3004/10070 [1:25:36<3:21:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3005/10070 [1:25:38<3:21:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3005/10070 [1:25:38<3:21:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3006/10070 [1:25:41<3:21:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3006/10070 [1:25:41<3:21:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3007/10070 [1:25:42<3:21:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3007/10070 [1:25:42<3:21:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3008/10070 [1:25:50<3:21:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3008/10070 [1:25:50<3:21:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3009/10070 [1:25:52<3:21:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3009/10070 [1:25:52<3:21:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3010/10070 [1:25:54<3:21:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3010/10070 [1:25:54<3:21:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3011/10070 [1:25:56<3:21:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3011/10070 [1:25:56<3:21:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3012/10070 [1:25:57<3:21:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3012/10070 [1:25:57<3:21:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3013/10070 [1:25:58<3:21:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3013/10070 [1:25:58<3:21:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3014/10070 [1:26:00<3:21:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3014/10070 [1:26:00<3:21:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3015/10070 [1:26:02<3:21:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3015/10070 [1:26:02<3:21:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3016/10070 [1:26:03<3:21:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3016/10070 [1:26:03<3:21:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3017/10070 [1:26:05<3:21:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3017/10070 [1:26:05<3:21:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3018/10070 [1:26:07<3:21:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3018/10070 [1:26:07<3:21:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3019/10070 [1:26:08<3:21:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3019/10070 [1:26:08<3:21:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3020/10070 [1:26:10<3:21:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3020/10070 [1:26:10<3:21:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3021/10070 [1:26:11<3:21:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3021/10070 [1:26:11<3:21:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3022/10070 [1:26:13<3:21:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3022/10070 [1:26:13<3:21:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3023/10070 [1:26:15<3:21:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3023/10070 [1:26:15<3:21:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3024/10070 [1:26:16<3:21:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3024/10070 [1:26:16<3:21:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3025/10070 [1:26:18<3:20:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3025/10070 [1:26:18<3:20:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3026/10070 [1:26:18<3:20:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3026/10070 [1:26:18<3:20:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3027/10070 [1:26:19<3:20:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3027/10070 [1:26:19<3:20:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3028/10070 [1:26:20<3:20:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3028/10070 [1:26:20<3:20:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3029/10070 [1:26:22<3:20:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3029/10070 [1:26:22<3:20:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3030/10070 [1:26:24<3:20:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3030/10070 [1:26:24<3:20:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3031/10070 [1:26:26<3:20:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3031/10070 [1:26:26<3:20:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3032/10070 [1:26:26<3:20:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3032/10070 [1:26:26<3:20:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3033/10070 [1:26:27<3:20:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3033/10070 [1:26:27<3:20:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3034/10070 [1:26:29<3:20:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3034/10070 [1:26:29<3:20:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3035/10070 [1:26:32<3:20:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3035/10070 [1:26:32<3:20:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3036/10070 [1:26:33<3:20:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3036/10070 [1:26:33<3:20:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3037/10070 [1:26:34<3:20:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3037/10070 [1:26:34<3:20:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3038/10070 [1:26:36<3:20:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3038/10070 [1:26:36<3:20:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3039/10070 [1:26:38<3:20:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3039/10070 [1:26:38<3:20:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3040/10070 [1:26:44<3:20:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3040/10070 [1:26:44<3:20:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3041/10070 [1:26:45<3:20:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3041/10070 [1:26:45<3:20:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3042/10070 [1:26:47<3:20:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3042/10070 [1:26:47<3:20:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3043/10070 [1:26:48<3:20:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3043/10070 [1:26:48<3:20:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3044/10070 [1:26:49<3:20:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3044/10070 [1:26:49<3:20:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3045/10070 [1:26:50<3:20:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3045/10070 [1:26:50<3:20:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3046/10070 [1:26:51<3:20:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3046/10070 [1:26:51<3:20:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3047/10070 [1:26:52<3:20:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3047/10070 [1:26:52<3:20:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3048/10070 [1:26:54<3:20:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3048/10070 [1:26:54<3:20:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3049/10070 [1:26:56<3:20:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3049/10070 [1:26:56<3:20:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3050/10070 [1:26:58<3:20:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3050/10070 [1:26:58<3:20:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3051/10070 [1:26:59<3:20:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3051/10070 [1:26:59<3:20:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3052/10070 [1:27:01<3:20:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3052/10070 [1:27:01<3:20:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3053/10070 [1:27:03<3:20:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3053/10070 [1:27:03<3:20:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3054/10070 [1:27:05<3:20:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3054/10070 [1:27:05<3:20:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3055/10070 [1:27:07<3:20:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3055/10070 [1:27:07<3:20:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3056/10070 [1:27:09<3:20:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3056/10070 [1:27:09<3:20:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3057/10070 [1:27:10<3:19:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3057/10070 [1:27:10<3:19:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3058/10070 [1:27:13<3:19:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3058/10070 [1:27:13<3:19:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3059/10070 [1:27:15<3:19:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3059/10070 [1:27:15<3:19:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3060/10070 [1:27:17<3:19:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3060/10070 [1:27:17<3:19:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3061/10070 [1:27:19<3:19:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3061/10070 [1:27:19<3:19:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3062/10070 [1:27:20<3:19:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3062/10070 [1:27:20<3:19:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3063/10070 [1:27:23<3:19:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3063/10070 [1:27:23<3:19:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3064/10070 [1:27:23<3:19:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3064/10070 [1:27:23<3:19:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3065/10070 [1:27:26<3:19:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3065/10070 [1:27:26<3:19:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3066/10070 [1:27:26<3:19:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3066/10070 [1:27:26<3:19:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3067/10070 [1:27:27<3:19:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3067/10070 [1:27:27<3:19:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3068/10070 [1:27:29<3:19:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3068/10070 [1:27:29<3:19:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3069/10070 [1:27:30<3:19:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3069/10070 [1:27:30<3:19:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3070/10070 [1:27:31<3:19:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3070/10070 [1:27:31<3:19:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  30%|▎| 3071/10070 [1:27:33<3:19:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  30%|▎| 3071/10070 [1:27:33<3:19:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3072/10070 [1:27:40<3:19:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3072/10070 [1:27:40<3:19:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3073/10070 [1:27:41<3:19:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3073/10070 [1:27:41<3:19:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3074/10070 [1:27:42<3:19:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3074/10070 [1:27:42<3:19:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3075/10070 [1:27:44<3:19:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3075/10070 [1:27:44<3:19:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3076/10070 [1:27:46<3:19:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3076/10070 [1:27:46<3:19:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3077/10070 [1:27:47<3:19:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3077/10070 [1:27:47<3:19:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3078/10070 [1:27:47<3:19:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3078/10070 [1:27:47<3:19:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3079/10070 [1:27:50<3:19:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3079/10070 [1:27:50<3:19:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3080/10070 [1:27:52<3:19:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3080/10070 [1:27:52<3:19:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3081/10070 [1:27:52<3:19:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3081/10070 [1:27:52<3:19:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3082/10070 [1:27:55<3:19:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3082/10070 [1:27:55<3:19:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3083/10070 [1:27:55<3:19:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3083/10070 [1:27:55<3:19:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3084/10070 [1:27:56<3:19:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3084/10070 [1:27:56<3:19:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3085/10070 [1:27:58<3:19:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3085/10070 [1:27:58<3:19:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3086/10070 [1:27:59<3:19:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3086/10070 [1:27:59<3:19:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3087/10070 [1:28:01<3:19:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3087/10070 [1:28:01<3:19:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3088/10070 [1:28:03<3:19:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3088/10070 [1:28:03<3:19:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3089/10070 [1:28:04<3:19:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3089/10070 [1:28:04<3:19:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3090/10070 [1:28:06<3:19:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3090/10070 [1:28:06<3:19:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3091/10070 [1:28:06<3:18:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3091/10070 [1:28:06<3:18:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3092/10070 [1:28:08<3:18:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3092/10070 [1:28:08<3:18:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3093/10070 [1:28:09<3:18:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3093/10070 [1:28:09<3:18:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3094/10070 [1:28:11<3:18:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3094/10070 [1:28:11<3:18:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3095/10070 [1:28:12<3:18:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3095/10070 [1:28:12<3:18:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3096/10070 [1:28:14<3:18:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3096/10070 [1:28:14<3:18:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3097/10070 [1:28:15<3:18:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3097/10070 [1:28:15<3:18:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3098/10070 [1:28:16<3:18:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3098/10070 [1:28:16<3:18:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3099/10070 [1:28:17<3:18:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3099/10070 [1:28:17<3:18:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3100/10070 [1:28:19<3:18:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3100/10070 [1:28:19<3:18:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3101/10070 [1:28:20<3:18:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3101/10070 [1:28:20<3:18:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3102/10070 [1:28:21<3:18:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3102/10070 [1:28:21<3:18:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3103/10070 [1:28:22<3:18:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3103/10070 [1:28:22<3:18:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3104/10070 [1:28:34<3:18:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3104/10070 [1:28:34<3:18:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3105/10070 [1:28:35<3:18:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3105/10070 [1:28:35<3:18:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3106/10070 [1:28:36<3:18:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3106/10070 [1:28:36<3:18:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3107/10070 [1:28:38<3:18:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3107/10070 [1:28:38<3:18:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3108/10070 [1:28:40<3:18:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3108/10070 [1:28:40<3:18:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3109/10070 [1:28:42<3:18:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3109/10070 [1:28:42<3:18:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3110/10070 [1:28:44<3:18:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3110/10070 [1:28:44<3:18:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3111/10070 [1:28:44<3:18:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3111/10070 [1:28:44<3:18:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3112/10070 [1:28:45<3:18:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3112/10070 [1:28:45<3:18:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3113/10070 [1:28:46<3:18:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3113/10070 [1:28:46<3:18:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3114/10070 [1:28:47<3:18:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3114/10070 [1:28:47<3:18:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3115/10070 [1:28:48<3:18:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3115/10070 [1:28:48<3:18:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3116/10070 [1:28:50<3:18:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3116/10070 [1:28:50<3:18:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3117/10070 [1:28:51<3:18:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3117/10070 [1:28:51<3:18:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3118/10070 [1:28:51<3:18:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3118/10070 [1:28:51<3:18:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3119/10070 [1:28:53<3:18:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3119/10070 [1:28:53<3:18:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3120/10070 [1:28:56<3:18:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3120/10070 [1:28:56<3:18:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3121/10070 [1:28:56<3:18:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3121/10070 [1:28:56<3:18:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3122/10070 [1:28:57<3:17:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3122/10070 [1:28:57<3:17:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3123/10070 [1:28:58<3:17:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3123/10070 [1:28:58<3:17:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3124/10070 [1:29:00<3:17:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3124/10070 [1:29:00<3:17:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3125/10070 [1:29:01<3:17:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3125/10070 [1:29:01<3:17:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3126/10070 [1:29:02<3:17:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3126/10070 [1:29:02<3:17:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3127/10070 [1:29:02<3:17:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3127/10070 [1:29:02<3:17:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3128/10070 [1:29:04<3:17:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3128/10070 [1:29:04<3:17:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3129/10070 [1:29:05<3:17:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3129/10070 [1:29:05<3:17:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3130/10070 [1:29:05<3:17:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3130/10070 [1:29:05<3:17:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3131/10070 [1:29:07<3:17:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3131/10070 [1:29:07<3:17:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3132/10070 [1:29:09<3:17:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3132/10070 [1:29:09<3:17:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3133/10070 [1:29:10<3:17:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3133/10070 [1:29:10<3:17:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3134/10070 [1:29:11<3:17:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3134/10070 [1:29:11<3:17:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3135/10070 [1:29:13<3:17:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3135/10070 [1:29:13<3:17:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3136/10070 [1:29:30<3:17:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3136/10070 [1:29:30<3:17:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3137/10070 [1:29:32<3:17:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3137/10070 [1:29:32<3:17:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3138/10070 [1:29:34<3:17:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3138/10070 [1:29:34<3:17:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3139/10070 [1:29:36<3:17:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3139/10070 [1:29:36<3:17:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3140/10070 [1:29:37<3:17:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3140/10070 [1:29:37<3:17:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3141/10070 [1:29:38<3:17:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3141/10070 [1:29:38<3:17:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3142/10070 [1:29:40<3:17:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3142/10070 [1:29:40<3:17:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3143/10070 [1:29:42<3:17:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3143/10070 [1:29:42<3:17:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3144/10070 [1:29:43<3:17:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3144/10070 [1:29:43<3:17:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3145/10070 [1:29:45<3:17:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3145/10070 [1:29:45<3:17:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3146/10070 [1:29:46<3:17:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3146/10070 [1:29:46<3:17:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3147/10070 [1:29:47<3:17:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3147/10070 [1:29:47<3:17:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3148/10070 [1:29:48<3:17:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3148/10070 [1:29:48<3:17:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3149/10070 [1:29:50<3:17:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3149/10070 [1:29:50<3:17:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3150/10070 [1:29:50<3:17:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3150/10070 [1:29:50<3:17:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3151/10070 [1:29:52<3:17:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3151/10070 [1:29:52<3:17:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3152/10070 [1:29:54<3:17:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3152/10070 [1:29:54<3:17:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3153/10070 [1:29:55<3:17:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3153/10070 [1:29:55<3:17:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3154/10070 [1:29:56<3:17:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3154/10070 [1:29:56<3:17:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3155/10070 [1:29:57<3:17:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3155/10070 [1:29:57<3:17:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3156/10070 [1:29:57<3:17:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3156/10070 [1:29:57<3:17:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3157/10070 [1:29:59<3:17:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3157/10070 [1:29:59<3:17:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3158/10070 [1:30:01<3:17:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3158/10070 [1:30:01<3:17:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3159/10070 [1:30:02<3:16:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3159/10070 [1:30:02<3:16:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3160/10070 [1:30:04<3:16:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3160/10070 [1:30:04<3:16:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3161/10070 [1:30:05<3:16:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3161/10070 [1:30:05<3:16:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3162/10070 [1:30:07<3:16:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3162/10070 [1:30:07<3:16:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3163/10070 [1:30:07<3:16:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3163/10070 [1:30:07<3:16:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3164/10070 [1:30:09<3:16:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3164/10070 [1:30:09<3:16:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3165/10070 [1:30:09<3:16:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3165/10070 [1:30:09<3:16:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3166/10070 [1:30:12<3:16:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3166/10070 [1:30:12<3:16:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3167/10070 [1:30:13<3:16:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3167/10070 [1:30:13<3:16:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3168/10070 [1:30:24<3:16:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3168/10070 [1:30:24<3:16:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3169/10070 [1:30:25<3:16:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3169/10070 [1:30:25<3:16:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3170/10070 [1:30:26<3:16:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3170/10070 [1:30:26<3:16:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3171/10070 [1:30:28<3:16:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3171/10070 [1:30:28<3:16:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  31%|▎| 3172/10070 [1:30:30<3:16:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  31%|▎| 3172/10070 [1:30:30<3:16:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3173/10070 [1:30:32<3:16:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3173/10070 [1:30:32<3:16:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3174/10070 [1:30:33<3:16:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3174/10070 [1:30:33<3:16:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3175/10070 [1:30:34<3:16:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3175/10070 [1:30:34<3:16:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3176/10070 [1:30:36<3:16:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3176/10070 [1:30:36<3:16:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3177/10070 [1:30:37<3:16:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3177/10070 [1:30:37<3:16:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3178/10070 [1:30:39<3:16:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3178/10070 [1:30:39<3:16:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3179/10070 [1:30:39<3:16:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3179/10070 [1:30:39<3:16:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3180/10070 [1:30:41<3:16:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3180/10070 [1:30:41<3:16:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3181/10070 [1:30:43<3:16:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3181/10070 [1:30:43<3:16:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3182/10070 [1:30:44<3:16:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3182/10070 [1:30:44<3:16:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3183/10070 [1:30:46<3:16:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3183/10070 [1:30:46<3:16:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3184/10070 [1:30:47<3:16:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3184/10070 [1:30:47<3:16:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3185/10070 [1:30:48<3:16:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3185/10070 [1:30:48<3:16:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3186/10070 [1:30:50<3:16:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3186/10070 [1:30:50<3:16:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3187/10070 [1:30:53<3:16:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3187/10070 [1:30:53<3:16:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3188/10070 [1:30:55<3:16:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3188/10070 [1:30:55<3:16:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3189/10070 [1:30:56<3:16:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3189/10070 [1:30:56<3:16:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3190/10070 [1:30:57<3:16:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3190/10070 [1:30:57<3:16:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3191/10070 [1:30:59<3:16:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3191/10070 [1:30:59<3:16:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3192/10070 [1:31:00<3:16:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3192/10070 [1:31:00<3:16:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3193/10070 [1:31:01<3:16:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3193/10070 [1:31:01<3:16:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3194/10070 [1:31:03<3:16:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3194/10070 [1:31:03<3:16:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3195/10070 [1:31:05<3:15:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3195/10070 [1:31:05<3:15:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3196/10070 [1:31:06<3:15:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3196/10070 [1:31:06<3:15:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3197/10070 [1:31:07<3:15:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3197/10070 [1:31:07<3:15:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3198/10070 [1:31:08<3:15:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3198/10070 [1:31:08<3:15:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3199/10070 [1:31:09<3:15:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3199/10070 [1:31:09<3:15:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3200/10070 [1:31:18<3:16:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3200/10070 [1:31:18<3:16:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3201/10070 [1:31:40<3:16:42,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3201/10070 [1:31:40<3:16:42,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3202/10070 [1:31:42<3:16:41,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3202/10070 [1:31:42<3:16:41,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3203/10070 [1:31:44<3:16:40,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3203/10070 [1:31:44<3:16:40,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3204/10070 [1:31:46<3:16:39,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3204/10070 [1:31:46<3:16:39,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3205/10070 [1:31:47<3:16:37,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3205/10070 [1:31:47<3:16:37,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3206/10070 [1:31:49<3:16:36,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3206/10070 [1:31:49<3:16:36,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3207/10070 [1:31:50<3:16:32,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3207/10070 [1:31:50<3:16:32,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3208/10070 [1:31:52<3:16:30,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3208/10070 [1:31:52<3:16:30,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3209/10070 [1:31:53<3:16:28,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3209/10070 [1:31:53<3:16:28,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3210/10070 [1:31:54<3:16:24,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3210/10070 [1:31:54<3:16:24,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3211/10070 [1:31:56<3:16:23,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3211/10070 [1:31:56<3:16:23,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3212/10070 [1:31:58<3:16:22,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3212/10070 [1:31:58<3:16:22,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3213/10070 [1:32:00<3:16:22,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3213/10070 [1:32:00<3:16:22,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3214/10070 [1:32:01<3:16:19,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3214/10070 [1:32:01<3:16:19,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3215/10070 [1:32:02<3:16:15,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3215/10070 [1:32:02<3:16:15,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3216/10070 [1:32:03<3:16:11,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3216/10070 [1:32:03<3:16:11,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3217/10070 [1:32:04<3:16:08,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3217/10070 [1:32:04<3:16:08,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3218/10070 [1:32:05<3:16:04,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3218/10070 [1:32:05<3:16:04,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3219/10070 [1:32:05<3:16:00,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3219/10070 [1:32:05<3:16:00,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3220/10070 [1:32:07<3:15:57,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3220/10070 [1:32:07<3:15:57,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3221/10070 [1:32:07<3:15:54,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3221/10070 [1:32:07<3:15:54,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3222/10070 [1:32:10<3:15:53,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3222/10070 [1:32:10<3:15:53,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3223/10070 [1:32:11<3:15:50,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3223/10070 [1:32:11<3:15:50,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3224/10070 [1:32:12<3:15:47,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3224/10070 [1:32:12<3:15:47,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3225/10070 [1:32:14<3:15:47,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3225/10070 [1:32:14<3:15:47,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3226/10070 [1:32:17<3:15:46,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3226/10070 [1:32:17<3:15:46,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3227/10070 [1:32:18<3:15:44,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3227/10070 [1:32:18<3:15:44,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3228/10070 [1:32:18<3:15:40,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3228/10070 [1:32:18<3:15:40,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3229/10070 [1:32:19<3:15:36,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3229/10070 [1:32:19<3:15:36,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3230/10070 [1:32:20<3:15:32,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3230/10070 [1:32:20<3:15:32,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3231/10070 [1:32:22<3:15:31,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3231/10070 [1:32:22<3:15:31,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3232/10070 [1:32:33<3:15:49,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3232/10070 [1:32:33<3:15:49,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3233/10070 [1:32:34<3:15:45,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3233/10070 [1:32:34<3:15:45,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3234/10070 [1:32:34<3:15:42,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3234/10070 [1:32:34<3:15:42,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3235/10070 [1:32:35<3:15:38,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3235/10070 [1:32:35<3:15:38,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3236/10070 [1:32:37<3:15:37,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3236/10070 [1:32:37<3:15:37,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3237/10070 [1:32:39<3:15:34,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3237/10070 [1:32:39<3:15:34,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3238/10070 [1:32:39<3:15:30,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3238/10070 [1:32:39<3:15:30,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3239/10070 [1:32:41<3:15:29,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3239/10070 [1:32:41<3:15:29,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3240/10070 [1:32:42<3:15:26,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3240/10070 [1:32:42<3:15:26,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3241/10070 [1:32:44<3:15:25,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3241/10070 [1:32:44<3:15:25,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3242/10070 [1:32:46<3:15:22,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3242/10070 [1:32:46<3:15:22,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3243/10070 [1:32:47<3:15:21,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3243/10070 [1:32:47<3:15:21,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3244/10070 [1:32:50<3:15:20,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3244/10070 [1:32:50<3:15:20,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3245/10070 [1:32:51<3:15:17,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3245/10070 [1:32:51<3:15:17,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3246/10070 [1:32:52<3:15:15,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3246/10070 [1:32:52<3:15:15,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3247/10070 [1:32:53<3:15:12,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3247/10070 [1:32:53<3:15:12,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3248/10070 [1:32:54<3:15:08,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3248/10070 [1:32:54<3:15:08,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3249/10070 [1:32:56<3:15:06,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3249/10070 [1:32:56<3:15:06,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3250/10070 [1:32:58<3:15:06,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3250/10070 [1:32:58<3:15:06,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3251/10070 [1:32:59<3:15:03,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3251/10070 [1:32:59<3:15:03,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3252/10070 [1:33:02<3:15:03,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3252/10070 [1:33:02<3:15:03,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3253/10070 [1:33:02<3:14:59,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3253/10070 [1:33:02<3:14:59,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3254/10070 [1:33:03<3:14:56,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3254/10070 [1:33:03<3:14:56,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3255/10070 [1:33:05<3:14:53,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3255/10070 [1:33:05<3:14:53,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3256/10070 [1:33:06<3:14:51,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3256/10070 [1:33:06<3:14:51,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3257/10070 [1:33:09<3:14:51,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3257/10070 [1:33:09<3:14:51,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3258/10070 [1:33:09<3:14:47,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3258/10070 [1:33:09<3:14:47,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3259/10070 [1:33:10<3:14:43,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3259/10070 [1:33:10<3:14:43,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3260/10070 [1:33:11<3:14:40,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3260/10070 [1:33:11<3:14:40,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3261/10070 [1:33:12<3:14:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3261/10070 [1:33:12<3:14:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3262/10070 [1:33:14<3:14:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3262/10070 [1:33:14<3:14:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3263/10070 [1:33:15<3:14:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3263/10070 [1:33:15<3:14:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3264/10070 [1:33:24<3:14:45,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3264/10070 [1:33:24<3:14:45,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3265/10070 [1:33:25<3:14:42,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3265/10070 [1:33:25<3:14:42,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3266/10070 [1:33:27<3:14:42,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3266/10070 [1:33:27<3:14:42,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3267/10070 [1:33:28<3:14:39,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3267/10070 [1:33:28<3:14:39,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3268/10070 [1:33:30<3:14:38,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3268/10070 [1:33:30<3:14:38,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3269/10070 [1:33:31<3:14:34,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3269/10070 [1:33:31<3:14:34,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3270/10070 [1:33:33<3:14:32,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3270/10070 [1:33:33<3:14:32,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3271/10070 [1:33:33<3:14:28,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3271/10070 [1:33:33<3:14:28,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  32%|▎| 3272/10070 [1:33:34<3:14:25,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  32%|▎| 3272/10070 [1:33:34<3:14:25,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3273/10070 [1:33:36<3:14:24,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3273/10070 [1:33:36<3:14:24,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3274/10070 [1:33:37<3:14:20,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3274/10070 [1:33:37<3:14:20,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3275/10070 [1:33:38<3:14:17,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3275/10070 [1:33:38<3:14:17,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3276/10070 [1:33:40<3:14:15,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3276/10070 [1:33:40<3:14:15,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3277/10070 [1:33:41<3:14:13,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3277/10070 [1:33:41<3:14:13,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3278/10070 [1:33:43<3:14:11,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3278/10070 [1:33:43<3:14:11,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3279/10070 [1:33:45<3:14:09,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3279/10070 [1:33:45<3:14:09,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3280/10070 [1:33:46<3:14:08,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3280/10070 [1:33:46<3:14:08,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3281/10070 [1:33:47<3:14:04,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3281/10070 [1:33:47<3:14:04,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3282/10070 [1:33:49<3:14:02,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3282/10070 [1:33:49<3:14:02,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3283/10070 [1:33:51<3:14:02,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3283/10070 [1:33:51<3:14:02,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3284/10070 [1:33:53<3:14:00,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3284/10070 [1:33:53<3:14:00,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3285/10070 [1:33:55<3:13:59,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3285/10070 [1:33:55<3:13:59,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3286/10070 [1:33:57<3:13:59,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3286/10070 [1:33:57<3:13:59,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3287/10070 [1:33:59<3:13:57,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3287/10070 [1:33:59<3:13:57,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3288/10070 [1:34:01<3:13:55,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3288/10070 [1:34:01<3:13:55,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3289/10070 [1:34:01<3:13:51,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3289/10070 [1:34:01<3:13:51,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3290/10070 [1:34:02<3:13:48,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3290/10070 [1:34:02<3:13:48,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3291/10070 [1:34:03<3:13:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3291/10070 [1:34:03<3:13:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3292/10070 [1:34:04<3:13:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3292/10070 [1:34:04<3:13:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3293/10070 [1:34:05<3:13:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3293/10070 [1:34:05<3:13:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3294/10070 [1:34:07<3:13:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3294/10070 [1:34:07<3:13:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3295/10070 [1:34:08<3:13:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3295/10070 [1:34:08<3:13:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3296/10070 [1:34:18<3:13:49,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3296/10070 [1:34:18<3:13:49,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3297/10070 [1:34:19<3:13:45,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3297/10070 [1:34:19<3:13:45,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3298/10070 [1:34:20<3:13:42,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3298/10070 [1:34:20<3:13:42,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3299/10070 [1:34:21<3:13:40,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3299/10070 [1:34:21<3:13:40,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3300/10070 [1:34:23<3:13:38,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3300/10070 [1:34:23<3:13:38,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3301/10070 [1:34:24<3:13:35,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3301/10070 [1:34:24<3:13:35,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3302/10070 [1:34:26<3:13:35,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3302/10070 [1:34:26<3:13:35,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3303/10070 [1:34:27<3:13:31,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3303/10070 [1:34:27<3:13:31,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3304/10070 [1:34:28<3:13:28,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3304/10070 [1:34:28<3:13:28,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3305/10070 [1:34:30<3:13:25,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3305/10070 [1:34:30<3:13:25,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3306/10070 [1:34:32<3:13:25,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3306/10070 [1:34:32<3:13:25,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3307/10070 [1:34:33<3:13:21,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3307/10070 [1:34:33<3:13:21,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3308/10070 [1:34:34<3:13:18,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3308/10070 [1:34:34<3:13:18,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3309/10070 [1:34:34<3:13:15,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3309/10070 [1:34:34<3:13:15,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3310/10070 [1:34:36<3:13:13,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3310/10070 [1:34:36<3:13:13,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3311/10070 [1:34:37<3:13:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3311/10070 [1:34:37<3:13:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3312/10070 [1:34:38<3:13:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3312/10070 [1:34:38<3:13:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3313/10070 [1:34:39<3:13:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3313/10070 [1:34:39<3:13:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3314/10070 [1:34:41<3:13:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3314/10070 [1:34:41<3:13:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3315/10070 [1:34:42<3:13:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3315/10070 [1:34:42<3:13:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3316/10070 [1:34:43<3:12:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3316/10070 [1:34:43<3:12:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3317/10070 [1:34:44<3:12:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3317/10070 [1:34:44<3:12:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3318/10070 [1:34:45<3:12:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3318/10070 [1:34:45<3:12:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3319/10070 [1:34:46<3:12:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3319/10070 [1:34:46<3:12:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3320/10070 [1:34:46<3:12:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3320/10070 [1:34:46<3:12:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3321/10070 [1:34:47<3:12:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3321/10070 [1:34:47<3:12:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3322/10070 [1:34:48<3:12:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3322/10070 [1:34:48<3:12:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3323/10070 [1:34:49<3:12:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3323/10070 [1:34:49<3:12:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3324/10070 [1:34:51<3:12:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3324/10070 [1:34:51<3:12:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3325/10070 [1:34:52<3:12:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3325/10070 [1:34:52<3:12:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3326/10070 [1:34:53<3:12:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3326/10070 [1:34:53<3:12:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3327/10070 [1:34:54<3:12:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3327/10070 [1:34:54<3:12:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3328/10070 [1:35:12<3:12:51,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3328/10070 [1:35:12<3:12:51,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3329/10070 [1:35:14<3:12:50,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3329/10070 [1:35:14<3:12:50,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3330/10070 [1:35:14<3:12:47,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3330/10070 [1:35:14<3:12:47,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3331/10070 [1:35:15<3:12:43,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3331/10070 [1:35:15<3:12:43,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3332/10070 [1:35:16<3:12:40,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3332/10070 [1:35:16<3:12:40,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3333/10070 [1:35:18<3:12:38,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3333/10070 [1:35:18<3:12:38,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3334/10070 [1:35:20<3:12:37,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3334/10070 [1:35:20<3:12:37,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3335/10070 [1:35:21<3:12:34,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3335/10070 [1:35:21<3:12:34,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3336/10070 [1:35:22<3:12:31,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3336/10070 [1:35:22<3:12:31,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3337/10070 [1:35:23<3:12:27,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3337/10070 [1:35:23<3:12:27,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3338/10070 [1:35:24<3:12:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3338/10070 [1:35:24<3:12:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3339/10070 [1:35:25<3:12:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3339/10070 [1:35:25<3:12:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3340/10070 [1:35:26<3:12:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3340/10070 [1:35:26<3:12:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3341/10070 [1:35:28<3:12:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3341/10070 [1:35:28<3:12:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3342/10070 [1:35:30<3:12:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3342/10070 [1:35:30<3:12:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3343/10070 [1:35:31<3:12:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3343/10070 [1:35:31<3:12:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3344/10070 [1:35:33<3:12:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3344/10070 [1:35:33<3:12:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3345/10070 [1:35:34<3:12:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3345/10070 [1:35:34<3:12:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3346/10070 [1:35:35<3:12:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3346/10070 [1:35:35<3:12:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3347/10070 [1:35:35<3:12:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3347/10070 [1:35:35<3:12:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3348/10070 [1:35:38<3:12:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3348/10070 [1:35:38<3:12:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3349/10070 [1:35:40<3:12:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3349/10070 [1:35:40<3:12:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3350/10070 [1:35:40<3:11:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3350/10070 [1:35:40<3:11:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3351/10070 [1:35:43<3:11:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3351/10070 [1:35:43<3:11:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3352/10070 [1:35:45<3:11:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3352/10070 [1:35:45<3:11:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3353/10070 [1:35:46<3:11:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3353/10070 [1:35:46<3:11:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3354/10070 [1:35:47<3:11:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3354/10070 [1:35:47<3:11:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3355/10070 [1:35:48<3:11:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3355/10070 [1:35:48<3:11:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3356/10070 [1:35:50<3:11:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3356/10070 [1:35:50<3:11:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3357/10070 [1:35:51<3:11:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3357/10070 [1:35:51<3:11:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3358/10070 [1:35:52<3:11:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3358/10070 [1:35:52<3:11:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3359/10070 [1:35:53<3:11:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3359/10070 [1:35:53<3:11:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3360/10070 [1:36:03<3:11:50,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3360/10070 [1:36:03<3:11:50,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3361/10070 [1:36:05<3:11:49,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3361/10070 [1:36:05<3:11:49,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3362/10070 [1:36:08<3:11:48,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3362/10070 [1:36:08<3:11:48,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3363/10070 [1:36:09<3:11:46,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3363/10070 [1:36:09<3:11:46,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3364/10070 [1:36:10<3:11:43,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3364/10070 [1:36:10<3:11:43,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3365/10070 [1:36:11<3:11:39,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3365/10070 [1:36:11<3:11:39,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3366/10070 [1:36:12<3:11:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3366/10070 [1:36:12<3:11:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3367/10070 [1:36:14<3:11:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3367/10070 [1:36:14<3:11:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3368/10070 [1:36:15<3:11:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3368/10070 [1:36:15<3:11:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3369/10070 [1:36:16<3:11:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3369/10070 [1:36:16<3:11:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3370/10070 [1:36:17<3:11:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3370/10070 [1:36:17<3:11:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3371/10070 [1:36:18<3:11:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3371/10070 [1:36:18<3:11:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3372/10070 [1:36:20<3:11:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3372/10070 [1:36:20<3:11:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  33%|▎| 3373/10070 [1:36:22<3:11:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  33%|▎| 3373/10070 [1:36:22<3:11:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3374/10070 [1:36:24<3:11:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3374/10070 [1:36:24<3:11:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3375/10070 [1:36:25<3:11:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3375/10070 [1:36:25<3:11:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3376/10070 [1:36:27<3:11:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3376/10070 [1:36:27<3:11:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3377/10070 [1:36:29<3:11:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3377/10070 [1:36:29<3:11:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3378/10070 [1:36:30<3:11:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3378/10070 [1:36:30<3:11:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3379/10070 [1:36:32<3:11:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3379/10070 [1:36:32<3:11:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3380/10070 [1:36:33<3:11:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3380/10070 [1:36:33<3:11:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3381/10070 [1:36:35<3:11:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3381/10070 [1:36:35<3:11:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3382/10070 [1:36:37<3:11:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3382/10070 [1:36:37<3:11:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3383/10070 [1:36:39<3:11:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3383/10070 [1:36:39<3:11:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3384/10070 [1:36:41<3:11:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3384/10070 [1:36:41<3:11:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3385/10070 [1:36:42<3:10:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3385/10070 [1:36:42<3:10:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3386/10070 [1:36:42<3:10:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3386/10070 [1:36:42<3:10:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3387/10070 [1:36:43<3:10:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3387/10070 [1:36:43<3:10:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3388/10070 [1:36:44<3:10:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3388/10070 [1:36:44<3:10:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3389/10070 [1:36:45<3:10:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3389/10070 [1:36:45<3:10:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3390/10070 [1:36:46<3:10:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3390/10070 [1:36:46<3:10:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3391/10070 [1:36:47<3:10:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3391/10070 [1:36:47<3:10:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3392/10070 [1:37:02<3:11:03,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3392/10070 [1:37:02<3:11:03,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3393/10070 [1:37:03<3:10:59,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3393/10070 [1:37:03<3:10:59,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3394/10070 [1:37:05<3:10:58,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3394/10070 [1:37:05<3:10:58,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3395/10070 [1:37:06<3:10:56,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3395/10070 [1:37:06<3:10:56,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3396/10070 [1:37:07<3:10:52,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3396/10070 [1:37:07<3:10:52,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3397/10070 [1:37:08<3:10:48,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3397/10070 [1:37:08<3:10:48,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3398/10070 [1:37:09<3:10:46,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3398/10070 [1:37:09<3:10:46,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3399/10070 [1:37:11<3:10:45,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3399/10070 [1:37:11<3:10:45,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3400/10070 [1:37:12<3:10:42,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3400/10070 [1:37:12<3:10:42,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3401/10070 [1:37:13<3:10:38,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3401/10070 [1:37:13<3:10:38,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3402/10070 [1:37:14<3:10:36,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3402/10070 [1:37:14<3:10:36,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3403/10070 [1:37:16<3:10:34,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3403/10070 [1:37:16<3:10:34,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3404/10070 [1:37:18<3:10:32,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3404/10070 [1:37:18<3:10:32,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3405/10070 [1:37:18<3:10:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3405/10070 [1:37:18<3:10:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3406/10070 [1:37:19<3:10:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3406/10070 [1:37:19<3:10:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3407/10070 [1:37:20<3:10:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3407/10070 [1:37:20<3:10:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3408/10070 [1:37:21<3:10:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3408/10070 [1:37:21<3:10:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3409/10070 [1:37:22<3:10:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3409/10070 [1:37:22<3:10:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3410/10070 [1:37:24<3:10:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3410/10070 [1:37:24<3:10:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3411/10070 [1:37:25<3:10:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3411/10070 [1:37:25<3:10:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3412/10070 [1:37:26<3:10:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3412/10070 [1:37:26<3:10:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3413/10070 [1:37:28<3:10:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3413/10070 [1:37:28<3:10:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3414/10070 [1:37:30<3:10:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3414/10070 [1:37:30<3:10:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3415/10070 [1:37:32<3:10:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3415/10070 [1:37:32<3:10:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3416/10070 [1:37:33<3:10:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3416/10070 [1:37:33<3:10:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3417/10070 [1:37:35<3:10:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3417/10070 [1:37:35<3:10:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3418/10070 [1:37:36<3:09:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3418/10070 [1:37:36<3:09:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3419/10070 [1:37:38<3:09:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3419/10070 [1:37:38<3:09:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3420/10070 [1:37:39<3:09:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3420/10070 [1:37:39<3:09:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3421/10070 [1:37:41<3:09:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3421/10070 [1:37:41<3:09:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3422/10070 [1:37:43<3:09:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3422/10070 [1:37:43<3:09:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3423/10070 [1:37:45<3:09:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3423/10070 [1:37:45<3:09:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3424/10070 [1:37:53<3:10:00,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3424/10070 [1:37:53<3:10:00,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3425/10070 [1:37:54<3:09:56,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3425/10070 [1:37:54<3:09:56,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3426/10070 [1:37:55<3:09:55,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3426/10070 [1:37:55<3:09:55,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3427/10070 [1:37:57<3:09:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3427/10070 [1:37:57<3:09:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3428/10070 [1:37:58<3:09:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3428/10070 [1:37:58<3:09:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3429/10070 [1:37:59<3:09:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3429/10070 [1:37:59<3:09:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3430/10070 [1:38:00<3:09:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3430/10070 [1:38:00<3:09:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3431/10070 [1:38:01<3:09:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3431/10070 [1:38:01<3:09:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3432/10070 [1:38:03<3:09:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3432/10070 [1:38:03<3:09:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3433/10070 [1:38:06<3:09:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3433/10070 [1:38:06<3:09:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3434/10070 [1:38:07<3:09:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3434/10070 [1:38:07<3:09:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3435/10070 [1:38:08<3:09:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3435/10070 [1:38:08<3:09:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3436/10070 [1:38:09<3:09:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3436/10070 [1:38:09<3:09:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3437/10070 [1:38:10<3:09:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3437/10070 [1:38:10<3:09:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3438/10070 [1:38:11<3:09:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3438/10070 [1:38:11<3:09:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3439/10070 [1:38:11<3:09:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3439/10070 [1:38:11<3:09:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3440/10070 [1:38:12<3:09:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3440/10070 [1:38:12<3:09:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3441/10070 [1:38:13<3:09:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3441/10070 [1:38:13<3:09:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3442/10070 [1:38:14<3:09:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3442/10070 [1:38:14<3:09:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3443/10070 [1:38:16<3:09:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3443/10070 [1:38:16<3:09:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3444/10070 [1:38:17<3:09:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3444/10070 [1:38:17<3:09:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3445/10070 [1:38:18<3:09:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3445/10070 [1:38:18<3:09:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3446/10070 [1:38:19<3:09:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3446/10070 [1:38:19<3:09:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3447/10070 [1:38:20<3:08:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3447/10070 [1:38:20<3:08:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3448/10070 [1:38:22<3:08:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3448/10070 [1:38:22<3:08:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3449/10070 [1:38:23<3:08:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3449/10070 [1:38:23<3:08:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3450/10070 [1:38:25<3:08:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3450/10070 [1:38:25<3:08:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3451/10070 [1:38:27<3:08:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3451/10070 [1:38:27<3:08:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3452/10070 [1:38:28<3:08:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3452/10070 [1:38:28<3:08:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3453/10070 [1:38:29<3:08:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3453/10070 [1:38:29<3:08:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3454/10070 [1:38:31<3:08:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3454/10070 [1:38:31<3:08:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3455/10070 [1:38:32<3:08:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3455/10070 [1:38:32<3:08:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3456/10070 [1:38:47<3:09:04,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3456/10070 [1:38:47<3:09:04,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3457/10070 [1:38:49<3:09:01,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3457/10070 [1:38:49<3:09:01,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3458/10070 [1:38:49<3:08:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3458/10070 [1:38:49<3:08:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3459/10070 [1:38:50<3:08:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3459/10070 [1:38:50<3:08:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3460/10070 [1:38:53<3:08:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3460/10070 [1:38:53<3:08:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3461/10070 [1:38:54<3:08:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3461/10070 [1:38:54<3:08:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3462/10070 [1:38:56<3:08:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3462/10070 [1:38:56<3:08:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3463/10070 [1:38:57<3:08:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3463/10070 [1:38:57<3:08:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3464/10070 [1:39:00<3:08:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3464/10070 [1:39:00<3:08:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3465/10070 [1:39:01<3:08:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3465/10070 [1:39:01<3:08:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3466/10070 [1:39:02<3:08:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3466/10070 [1:39:02<3:08:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3467/10070 [1:39:04<3:08:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3467/10070 [1:39:04<3:08:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3468/10070 [1:39:06<3:08:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3468/10070 [1:39:06<3:08:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3469/10070 [1:39:07<3:08:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3469/10070 [1:39:07<3:08:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3470/10070 [1:39:09<3:08:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3470/10070 [1:39:09<3:08:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3471/10070 [1:39:10<3:08:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3471/10070 [1:39:10<3:08:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3472/10070 [1:39:11<3:08:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3472/10070 [1:39:11<3:08:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3473/10070 [1:39:12<3:08:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3473/10070 [1:39:12<3:08:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  34%|▎| 3474/10070 [1:39:14<3:08:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  34%|▎| 3474/10070 [1:39:14<3:08:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3475/10070 [1:39:15<3:08:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3475/10070 [1:39:15<3:08:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3476/10070 [1:39:16<3:08:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3476/10070 [1:39:16<3:08:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3477/10070 [1:39:18<3:08:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3477/10070 [1:39:18<3:08:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3478/10070 [1:39:20<3:08:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3478/10070 [1:39:20<3:08:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3479/10070 [1:39:20<3:08:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3479/10070 [1:39:20<3:08:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3480/10070 [1:39:23<3:08:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3480/10070 [1:39:23<3:08:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3481/10070 [1:39:24<3:08:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3481/10070 [1:39:24<3:08:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3482/10070 [1:39:25<3:08:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3482/10070 [1:39:25<3:08:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3483/10070 [1:39:26<3:08:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3483/10070 [1:39:26<3:08:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3484/10070 [1:39:27<3:08:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3484/10070 [1:39:27<3:08:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3485/10070 [1:39:29<3:07:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3485/10070 [1:39:29<3:07:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3486/10070 [1:39:31<3:07:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3486/10070 [1:39:31<3:07:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3487/10070 [1:39:33<3:07:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3487/10070 [1:39:33<3:07:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3488/10070 [1:39:43<3:08:10,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3488/10070 [1:39:43<3:08:10,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3489/10070 [1:39:44<3:08:07,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3489/10070 [1:39:44<3:08:07,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3490/10070 [1:39:46<3:08:06,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3490/10070 [1:39:46<3:08:06,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3491/10070 [1:39:47<3:08:04,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3491/10070 [1:39:47<3:08:04,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3492/10070 [1:39:49<3:08:02,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3492/10070 [1:39:49<3:08:02,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3493/10070 [1:39:51<3:08:01,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3493/10070 [1:39:51<3:08:01,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3494/10070 [1:39:52<3:07:58,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3494/10070 [1:39:52<3:07:58,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3495/10070 [1:39:53<3:07:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3495/10070 [1:39:53<3:07:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3496/10070 [1:39:55<3:07:55,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3496/10070 [1:39:55<3:07:55,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3497/10070 [1:39:56<3:07:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3497/10070 [1:39:56<3:07:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3498/10070 [1:39:58<3:07:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3498/10070 [1:39:58<3:07:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3499/10070 [1:40:01<3:07:50,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3499/10070 [1:40:01<3:07:50,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3500/10070 [1:40:03<3:07:49,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3500/10070 [1:40:03<3:07:49,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3501/10070 [1:40:04<3:07:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3501/10070 [1:40:04<3:07:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3502/10070 [1:40:06<3:07:45,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3502/10070 [1:40:06<3:07:45,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3503/10070 [1:40:07<3:07:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3503/10070 [1:40:07<3:07:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3504/10070 [1:40:07<3:07:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3504/10070 [1:40:07<3:07:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3505/10070 [1:40:08<3:07:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3505/10070 [1:40:08<3:07:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3506/10070 [1:40:09<3:07:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3506/10070 [1:40:09<3:07:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3507/10070 [1:40:11<3:07:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3507/10070 [1:40:11<3:07:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3508/10070 [1:40:12<3:07:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3508/10070 [1:40:12<3:07:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3509/10070 [1:40:12<3:07:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3509/10070 [1:40:12<3:07:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3510/10070 [1:40:13<3:07:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3510/10070 [1:40:13<3:07:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3511/10070 [1:40:14<3:07:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3511/10070 [1:40:14<3:07:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3512/10070 [1:40:16<3:07:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3512/10070 [1:40:16<3:07:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3513/10070 [1:40:18<3:07:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3513/10070 [1:40:18<3:07:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3514/10070 [1:40:20<3:07:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3514/10070 [1:40:20<3:07:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3515/10070 [1:40:20<3:07:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3515/10070 [1:40:20<3:07:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3516/10070 [1:40:21<3:07:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3516/10070 [1:40:21<3:07:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3517/10070 [1:40:23<3:07:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3517/10070 [1:40:23<3:07:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3518/10070 [1:40:23<3:06:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3518/10070 [1:40:23<3:06:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3519/10070 [1:40:25<3:06:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3519/10070 [1:40:25<3:06:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3520/10070 [1:40:36<3:07:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3520/10070 [1:40:36<3:07:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3521/10070 [1:40:37<3:07:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3521/10070 [1:40:37<3:07:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3522/10070 [1:40:39<3:07:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3522/10070 [1:40:39<3:07:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3523/10070 [1:40:42<3:07:08,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3523/10070 [1:40:42<3:07:08,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3524/10070 [1:40:42<3:07:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3524/10070 [1:40:42<3:07:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3525/10070 [1:40:44<3:07:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3525/10070 [1:40:44<3:07:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3526/10070 [1:40:46<3:07:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3526/10070 [1:40:46<3:07:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3527/10070 [1:40:48<3:06:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3527/10070 [1:40:48<3:06:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3528/10070 [1:40:50<3:06:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3528/10070 [1:40:50<3:06:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3529/10070 [1:40:52<3:06:58,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3529/10070 [1:40:52<3:06:58,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3530/10070 [1:40:53<3:06:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3530/10070 [1:40:53<3:06:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3531/10070 [1:40:54<3:06:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3531/10070 [1:40:54<3:06:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3532/10070 [1:40:56<3:06:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3532/10070 [1:40:56<3:06:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3533/10070 [1:40:58<3:06:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3533/10070 [1:40:58<3:06:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3534/10070 [1:41:00<3:06:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3534/10070 [1:41:00<3:06:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3535/10070 [1:41:02<3:06:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3535/10070 [1:41:02<3:06:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3536/10070 [1:41:04<3:06:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3536/10070 [1:41:04<3:06:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3537/10070 [1:41:04<3:06:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3537/10070 [1:41:04<3:06:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3538/10070 [1:41:07<3:06:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3538/10070 [1:41:07<3:06:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3539/10070 [1:41:09<3:06:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3539/10070 [1:41:09<3:06:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3540/10070 [1:41:11<3:06:39,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3540/10070 [1:41:11<3:06:39,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3541/10070 [1:41:12<3:06:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3541/10070 [1:41:12<3:06:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3542/10070 [1:41:14<3:06:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3542/10070 [1:41:14<3:06:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3543/10070 [1:41:15<3:06:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3543/10070 [1:41:15<3:06:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3544/10070 [1:41:15<3:06:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3544/10070 [1:41:15<3:06:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3545/10070 [1:41:18<3:06:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3545/10070 [1:41:18<3:06:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3546/10070 [1:41:18<3:06:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3546/10070 [1:41:18<3:06:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3547/10070 [1:41:19<3:06:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3547/10070 [1:41:19<3:06:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3548/10070 [1:41:21<3:06:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3548/10070 [1:41:21<3:06:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3549/10070 [1:41:23<3:06:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3549/10070 [1:41:23<3:06:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3550/10070 [1:41:24<3:06:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3550/10070 [1:41:24<3:06:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3551/10070 [1:41:25<3:06:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3551/10070 [1:41:25<3:06:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3552/10070 [1:41:33<3:06:21,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3552/10070 [1:41:33<3:06:21,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3553/10070 [1:41:34<3:06:18,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3553/10070 [1:41:34<3:06:18,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3554/10070 [1:41:34<3:06:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3554/10070 [1:41:34<3:06:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3555/10070 [1:41:36<3:06:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3555/10070 [1:41:36<3:06:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3556/10070 [1:41:38<3:06:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3556/10070 [1:41:38<3:06:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3557/10070 [1:41:39<3:06:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3557/10070 [1:41:39<3:06:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3558/10070 [1:41:42<3:06:08,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3558/10070 [1:41:42<3:06:08,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3559/10070 [1:41:44<3:06:07,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3559/10070 [1:41:44<3:06:07,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3560/10070 [1:41:45<3:06:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3560/10070 [1:41:45<3:06:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3561/10070 [1:41:45<3:06:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3561/10070 [1:41:45<3:06:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3562/10070 [1:41:48<3:05:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3562/10070 [1:41:48<3:05:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3563/10070 [1:41:48<3:05:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3563/10070 [1:41:48<3:05:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3564/10070 [1:41:50<3:05:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3564/10070 [1:41:50<3:05:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3565/10070 [1:41:51<3:05:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3565/10070 [1:41:51<3:05:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3566/10070 [1:41:53<3:05:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3566/10070 [1:41:53<3:05:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3567/10070 [1:41:55<3:05:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3567/10070 [1:41:55<3:05:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3568/10070 [1:41:56<3:05:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3568/10070 [1:41:56<3:05:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3569/10070 [1:41:57<3:05:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3569/10070 [1:41:57<3:05:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3570/10070 [1:41:59<3:05:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3570/10070 [1:41:59<3:05:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3571/10070 [1:42:01<3:05:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3571/10070 [1:42:01<3:05:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3572/10070 [1:42:01<3:05:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3572/10070 [1:42:01<3:05:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3573/10070 [1:42:03<3:05:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3573/10070 [1:42:03<3:05:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  35%|▎| 3574/10070 [1:42:03<3:05:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  35%|▎| 3574/10070 [1:42:03<3:05:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3575/10070 [1:42:05<3:05:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3575/10070 [1:42:05<3:05:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3576/10070 [1:42:06<3:05:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3576/10070 [1:42:06<3:05:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3577/10070 [1:42:08<3:05:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3577/10070 [1:42:08<3:05:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3578/10070 [1:42:09<3:05:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3578/10070 [1:42:09<3:05:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3579/10070 [1:42:11<3:05:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3579/10070 [1:42:11<3:05:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3580/10070 [1:42:13<3:05:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3580/10070 [1:42:13<3:05:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3581/10070 [1:42:14<3:05:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3581/10070 [1:42:14<3:05:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3582/10070 [1:42:17<3:05:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3582/10070 [1:42:17<3:05:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3583/10070 [1:42:17<3:05:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3583/10070 [1:42:17<3:05:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3584/10070 [1:42:29<3:05:28,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3584/10070 [1:42:29<3:05:28,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3585/10070 [1:42:31<3:05:27,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3585/10070 [1:42:31<3:05:27,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3586/10070 [1:42:31<3:05:23,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3586/10070 [1:42:31<3:05:23,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3587/10070 [1:42:32<3:05:20,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3587/10070 [1:42:32<3:05:20,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3588/10070 [1:42:34<3:05:18,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3588/10070 [1:42:34<3:05:18,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3589/10070 [1:42:36<3:05:17,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3589/10070 [1:42:36<3:05:17,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3590/10070 [1:42:37<3:05:13,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3590/10070 [1:42:37<3:05:13,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3591/10070 [1:42:38<3:05:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3591/10070 [1:42:38<3:05:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3592/10070 [1:42:40<3:05:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3592/10070 [1:42:40<3:05:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3593/10070 [1:42:42<3:05:08,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3593/10070 [1:42:42<3:05:08,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3594/10070 [1:42:43<3:05:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3594/10070 [1:42:43<3:05:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3595/10070 [1:42:44<3:05:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3595/10070 [1:42:44<3:05:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3596/10070 [1:42:45<3:05:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3596/10070 [1:42:45<3:05:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3597/10070 [1:42:46<3:04:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3597/10070 [1:42:46<3:04:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3598/10070 [1:42:47<3:04:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3598/10070 [1:42:47<3:04:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3599/10070 [1:42:48<3:04:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3599/10070 [1:42:48<3:04:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3600/10070 [1:42:50<3:04:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3600/10070 [1:42:50<3:04:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3601/10070 [1:42:51<3:04:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3601/10070 [1:42:51<3:04:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3602/10070 [1:42:53<3:04:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3602/10070 [1:42:53<3:04:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3603/10070 [1:42:55<3:04:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3603/10070 [1:42:55<3:04:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3604/10070 [1:42:55<3:04:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3604/10070 [1:42:55<3:04:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3605/10070 [1:42:56<3:04:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3605/10070 [1:42:56<3:04:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3606/10070 [1:42:58<3:04:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3606/10070 [1:42:58<3:04:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3607/10070 [1:42:59<3:04:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3607/10070 [1:42:59<3:04:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3608/10070 [1:43:00<3:04:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3608/10070 [1:43:00<3:04:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3609/10070 [1:43:00<3:04:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3609/10070 [1:43:00<3:04:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3610/10070 [1:43:01<3:04:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3610/10070 [1:43:01<3:04:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3611/10070 [1:43:02<3:04:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3611/10070 [1:43:02<3:04:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3612/10070 [1:43:03<3:04:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3612/10070 [1:43:03<3:04:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3613/10070 [1:43:04<3:04:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3613/10070 [1:43:04<3:04:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3614/10070 [1:43:06<3:04:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3614/10070 [1:43:06<3:04:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3615/10070 [1:43:08<3:04:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3615/10070 [1:43:08<3:04:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3616/10070 [1:43:26<3:04:37,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3616/10070 [1:43:26<3:04:37,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3617/10070 [1:43:28<3:04:35,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3617/10070 [1:43:28<3:04:35,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3618/10070 [1:43:29<3:04:33,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3618/10070 [1:43:29<3:04:33,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3619/10070 [1:43:30<3:04:29,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3619/10070 [1:43:30<3:04:29,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3620/10070 [1:43:32<3:04:28,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3620/10070 [1:43:32<3:04:28,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3621/10070 [1:43:32<3:04:25,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3621/10070 [1:43:32<3:04:25,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3622/10070 [1:43:34<3:04:23,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3622/10070 [1:43:34<3:04:23,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3623/10070 [1:43:36<3:04:22,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3623/10070 [1:43:36<3:04:22,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3624/10070 [1:43:38<3:04:21,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3624/10070 [1:43:38<3:04:21,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3625/10070 [1:43:39<3:04:17,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3625/10070 [1:43:39<3:04:17,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3626/10070 [1:43:41<3:04:16,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3626/10070 [1:43:41<3:04:16,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3627/10070 [1:43:42<3:04:13,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3627/10070 [1:43:42<3:04:13,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3628/10070 [1:43:44<3:04:12,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3628/10070 [1:43:44<3:04:12,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3629/10070 [1:43:46<3:04:11,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3629/10070 [1:43:46<3:04:11,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3630/10070 [1:43:47<3:04:07,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3630/10070 [1:43:47<3:04:07,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3631/10070 [1:43:47<3:04:04,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3631/10070 [1:43:47<3:04:04,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3632/10070 [1:43:48<3:04:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3632/10070 [1:43:48<3:04:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3633/10070 [1:43:49<3:03:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3633/10070 [1:43:49<3:03:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3634/10070 [1:43:51<3:03:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3634/10070 [1:43:51<3:03:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3635/10070 [1:43:53<3:03:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3635/10070 [1:43:53<3:03:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3636/10070 [1:43:54<3:03:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3636/10070 [1:43:54<3:03:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3637/10070 [1:43:56<3:03:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3637/10070 [1:43:56<3:03:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3638/10070 [1:43:58<3:03:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3638/10070 [1:43:58<3:03:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3639/10070 [1:44:00<3:03:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3639/10070 [1:44:00<3:03:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3640/10070 [1:44:02<3:03:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3640/10070 [1:44:02<3:03:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3641/10070 [1:44:04<3:03:45,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3641/10070 [1:44:04<3:03:45,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3642/10070 [1:44:06<3:03:45,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3642/10070 [1:44:06<3:03:45,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3643/10070 [1:44:07<3:03:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3643/10070 [1:44:07<3:03:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3644/10070 [1:44:08<3:03:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3644/10070 [1:44:08<3:03:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3645/10070 [1:44:10<3:03:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3645/10070 [1:44:10<3:03:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3646/10070 [1:44:10<3:03:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3646/10070 [1:44:10<3:03:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3647/10070 [1:44:11<3:03:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3647/10070 [1:44:11<3:03:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3648/10070 [1:44:19<3:03:39,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3648/10070 [1:44:19<3:03:39,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3649/10070 [1:44:21<3:03:37,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3649/10070 [1:44:21<3:03:37,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3650/10070 [1:44:22<3:03:34,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3650/10070 [1:44:22<3:03:34,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3651/10070 [1:44:22<3:03:30,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3651/10070 [1:44:22<3:03:30,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3652/10070 [1:44:25<3:03:30,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3652/10070 [1:44:25<3:03:30,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3653/10070 [1:44:25<3:03:26,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3653/10070 [1:44:25<3:03:26,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3654/10070 [1:44:26<3:03:23,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3654/10070 [1:44:26<3:03:23,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3655/10070 [1:44:29<3:03:23,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3655/10070 [1:44:29<3:03:23,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3656/10070 [1:44:31<3:03:22,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3656/10070 [1:44:31<3:03:22,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3657/10070 [1:44:32<3:03:19,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3657/10070 [1:44:32<3:03:19,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3658/10070 [1:44:33<3:03:16,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3658/10070 [1:44:33<3:03:16,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3659/10070 [1:44:35<3:03:15,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3659/10070 [1:44:35<3:03:15,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3660/10070 [1:44:36<3:03:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3660/10070 [1:44:36<3:03:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3661/10070 [1:44:37<3:03:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|���| 3661/10070 [1:44:37<3:03:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3662/10070 [1:44:39<3:03:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3662/10070 [1:44:39<3:03:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3663/10070 [1:44:41<3:03:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3663/10070 [1:44:41<3:03:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3664/10070 [1:44:42<3:03:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3664/10070 [1:44:42<3:03:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3665/10070 [1:44:44<3:03:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3665/10070 [1:44:44<3:03:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3666/10070 [1:44:46<3:03:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3666/10070 [1:44:46<3:03:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3667/10070 [1:44:47<3:02:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3667/10070 [1:44:47<3:02:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3668/10070 [1:44:48<3:02:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3668/10070 [1:44:48<3:02:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3669/10070 [1:44:49<3:02:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3669/10070 [1:44:49<3:02:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3670/10070 [1:44:51<3:02:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3670/10070 [1:44:51<3:02:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3671/10070 [1:44:53<3:02:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3671/10070 [1:44:53<3:02:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3672/10070 [1:44:54<3:02:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3672/10070 [1:44:54<3:02:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3673/10070 [1:44:55<3:02:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3673/10070 [1:44:55<3:02:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3674/10070 [1:44:55<3:02:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3674/10070 [1:44:55<3:02:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  36%|▎| 3675/10070 [1:44:57<3:02:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  36%|▎| 3675/10070 [1:44:57<3:02:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3676/10070 [1:44:59<3:02:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3676/10070 [1:44:59<3:02:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3677/10070 [1:45:00<3:02:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3677/10070 [1:45:00<3:02:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3678/10070 [1:45:01<3:02:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3678/10070 [1:45:01<3:02:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3679/10070 [1:45:03<3:02:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3679/10070 [1:45:03<3:02:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3680/10070 [1:45:13<3:02:43,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3680/10070 [1:45:13<3:02:43,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3681/10070 [1:45:14<3:02:39,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3681/10070 [1:45:14<3:02:39,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3682/10070 [1:45:15<3:02:36,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3682/10070 [1:45:15<3:02:36,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3683/10070 [1:45:16<3:02:34,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3683/10070 [1:45:16<3:02:34,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3684/10070 [1:45:18<3:02:32,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3684/10070 [1:45:18<3:02:32,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3685/10070 [1:45:20<3:02:32,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3685/10070 [1:45:20<3:02:32,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3686/10070 [1:45:22<3:02:30,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3686/10070 [1:45:22<3:02:30,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3687/10070 [1:45:24<3:02:28,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3687/10070 [1:45:24<3:02:28,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3688/10070 [1:45:25<3:02:26,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3688/10070 [1:45:25<3:02:26,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3689/10070 [1:45:26<3:02:23,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3689/10070 [1:45:26<3:02:23,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3690/10070 [1:45:27<3:02:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3690/10070 [1:45:27<3:02:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3691/10070 [1:45:28<3:02:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3691/10070 [1:45:28<3:02:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3692/10070 [1:45:30<3:02:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3692/10070 [1:45:30<3:02:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3693/10070 [1:45:32<3:02:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3693/10070 [1:45:32<3:02:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3694/10070 [1:45:34<3:02:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3694/10070 [1:45:34<3:02:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3695/10070 [1:45:35<3:02:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3695/10070 [1:45:35<3:02:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3696/10070 [1:45:36<3:02:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3696/10070 [1:45:36<3:02:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3697/10070 [1:45:37<3:02:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3697/10070 [1:45:37<3:02:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3698/10070 [1:45:38<3:02:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3698/10070 [1:45:38<3:02:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3699/10070 [1:45:39<3:01:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3699/10070 [1:45:39<3:01:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3700/10070 [1:45:41<3:01:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3700/10070 [1:45:41<3:01:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3701/10070 [1:45:42<3:01:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3701/10070 [1:45:42<3:01:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3702/10070 [1:45:44<3:01:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3702/10070 [1:45:44<3:01:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3703/10070 [1:45:44<3:01:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3703/10070 [1:45:44<3:01:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3704/10070 [1:45:45<3:01:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3704/10070 [1:45:45<3:01:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3705/10070 [1:45:46<3:01:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3705/10070 [1:45:46<3:01:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3706/10070 [1:45:48<3:01:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3706/10070 [1:45:48<3:01:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3707/10070 [1:45:50<3:01:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3707/10070 [1:45:50<3:01:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3708/10070 [1:45:50<3:01:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3708/10070 [1:45:50<3:01:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3709/10070 [1:45:52<3:01:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3709/10070 [1:45:52<3:01:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3710/10070 [1:45:53<3:01:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3710/10070 [1:45:53<3:01:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3711/10070 [1:45:55<3:01:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3711/10070 [1:45:55<3:01:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3712/10070 [1:46:04<3:01:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3712/10070 [1:46:04<3:01:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3713/10070 [1:46:07<3:01:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3713/10070 [1:46:07<3:01:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3714/10070 [1:46:09<3:01:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3714/10070 [1:46:09<3:01:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3715/10070 [1:46:09<3:01:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3715/10070 [1:46:09<3:01:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3716/10070 [1:46:10<3:01:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3716/10070 [1:46:10<3:01:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3717/10070 [1:46:12<3:01:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3717/10070 [1:46:12<3:01:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3718/10070 [1:46:13<3:01:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3718/10070 [1:46:13<3:01:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3719/10070 [1:46:14<3:01:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3719/10070 [1:46:14<3:01:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3720/10070 [1:46:15<3:01:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3720/10070 [1:46:15<3:01:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3721/10070 [1:46:16<3:01:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3721/10070 [1:46:16<3:01:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3722/10070 [1:46:18<3:01:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3722/10070 [1:46:18<3:01:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3723/10070 [1:46:20<3:01:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3723/10070 [1:46:20<3:01:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3724/10070 [1:46:21<3:01:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3724/10070 [1:46:21<3:01:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3725/10070 [1:46:22<3:01:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3725/10070 [1:46:22<3:01:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3726/10070 [1:46:23<3:01:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3726/10070 [1:46:23<3:01:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3727/10070 [1:46:25<3:01:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3727/10070 [1:46:25<3:01:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3728/10070 [1:46:27<3:01:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3728/10070 [1:46:27<3:01:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3729/10070 [1:46:28<3:01:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3729/10070 [1:46:28<3:01:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3730/10070 [1:46:30<3:01:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3730/10070 [1:46:30<3:01:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3731/10070 [1:46:30<3:00:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3731/10070 [1:46:30<3:00:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3732/10070 [1:46:31<3:00:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3732/10070 [1:46:31<3:00:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3733/10070 [1:46:32<3:00:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3733/10070 [1:46:32<3:00:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3734/10070 [1:46:34<3:00:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3734/10070 [1:46:34<3:00:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3735/10070 [1:46:36<3:00:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3735/10070 [1:46:36<3:00:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3736/10070 [1:46:37<3:00:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3736/10070 [1:46:37<3:00:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3737/10070 [1:46:39<3:00:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3737/10070 [1:46:39<3:00:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3738/10070 [1:46:41<3:00:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3738/10070 [1:46:41<3:00:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3739/10070 [1:46:43<3:00:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3739/10070 [1:46:43<3:00:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3740/10070 [1:46:45<3:00:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3740/10070 [1:46:45<3:00:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3741/10070 [1:46:46<3:00:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3741/10070 [1:46:46<3:00:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3742/10070 [1:46:47<3:00:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3742/10070 [1:46:47<3:00:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3743/10070 [1:46:48<3:00:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3743/10070 [1:46:48<3:00:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3744/10070 [1:46:56<3:00:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3744/10070 [1:46:56<3:00:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3745/10070 [1:46:57<3:00:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3745/10070 [1:46:57<3:00:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3746/10070 [1:46:59<3:00:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3746/10070 [1:46:59<3:00:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3747/10070 [1:47:01<3:00:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3747/10070 [1:47:01<3:00:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3748/10070 [1:47:02<3:00:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3748/10070 [1:47:02<3:00:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3749/10070 [1:47:04<3:00:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3749/10070 [1:47:04<3:00:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3750/10070 [1:47:06<3:00:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3750/10070 [1:47:06<3:00:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3751/10070 [1:47:07<3:00:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3751/10070 [1:47:07<3:00:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3752/10070 [1:47:08<3:00:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3752/10070 [1:47:08<3:00:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3753/10070 [1:47:10<3:00:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3753/10070 [1:47:10<3:00:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3754/10070 [1:47:11<3:00:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3754/10070 [1:47:11<3:00:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3755/10070 [1:47:12<3:00:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3755/10070 [1:47:12<3:00:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3756/10070 [1:47:14<3:00:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3756/10070 [1:47:14<3:00:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3757/10070 [1:47:15<3:00:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3757/10070 [1:47:15<3:00:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3758/10070 [1:47:17<3:00:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3758/10070 [1:47:17<3:00:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3759/10070 [1:47:18<3:00:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3759/10070 [1:47:18<3:00:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3760/10070 [1:47:19<3:00:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3760/10070 [1:47:19<3:00:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3761/10070 [1:47:19<3:00:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3761/10070 [1:47:19<3:00:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3762/10070 [1:47:21<3:00:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3762/10070 [1:47:21<3:00:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3763/10070 [1:47:21<2:59:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3763/10070 [1:47:21<2:59:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3764/10070 [1:47:23<2:59:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3764/10070 [1:47:23<2:59:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3765/10070 [1:47:25<2:59:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3765/10070 [1:47:25<2:59:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3766/10070 [1:47:26<2:59:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3766/10070 [1:47:26<2:59:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3767/10070 [1:47:28<2:59:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3767/10070 [1:47:28<2:59:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3768/10070 [1:47:29<2:59:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3768/10070 [1:47:29<2:59:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3769/10070 [1:47:30<2:59:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3769/10070 [1:47:30<2:59:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3770/10070 [1:47:31<2:59:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3770/10070 [1:47:31<2:59:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3771/10070 [1:47:32<2:59:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3771/10070 [1:47:32<2:59:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3772/10070 [1:47:32<2:59:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3772/10070 [1:47:32<2:59:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3773/10070 [1:47:35<2:59:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3773/10070 [1:47:35<2:59:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3774/10070 [1:47:35<2:59:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3774/10070 [1:47:35<2:59:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3775/10070 [1:47:38<2:59:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3775/10070 [1:47:38<2:59:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  37%|▎| 3776/10070 [1:47:48<2:59:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  37%|▎| 3776/10070 [1:47:48<2:59:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3777/10070 [1:47:49<2:59:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3777/10070 [1:47:49<2:59:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3778/10070 [1:47:51<2:59:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3778/10070 [1:47:51<2:59:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3779/10070 [1:47:52<2:59:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3779/10070 [1:47:52<2:59:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3780/10070 [1:47:53<2:59:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3780/10070 [1:47:53<2:59:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3781/10070 [1:47:55<2:59:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3781/10070 [1:47:55<2:59:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3782/10070 [1:47:56<2:59:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3782/10070 [1:47:56<2:59:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3783/10070 [1:47:58<2:59:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3783/10070 [1:47:58<2:59:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3784/10070 [1:48:01<2:59:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3784/10070 [1:48:01<2:59:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3785/10070 [1:48:02<2:59:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3785/10070 [1:48:02<2:59:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3786/10070 [1:48:05<2:59:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3786/10070 [1:48:05<2:59:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3787/10070 [1:48:06<2:59:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3787/10070 [1:48:06<2:59:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3788/10070 [1:48:08<2:59:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3788/10070 [1:48:08<2:59:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3789/10070 [1:48:10<2:59:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3789/10070 [1:48:10<2:59:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3790/10070 [1:48:11<2:59:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3790/10070 [1:48:11<2:59:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3791/10070 [1:48:12<2:59:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3791/10070 [1:48:12<2:59:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3792/10070 [1:48:13<2:59:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3792/10070 [1:48:13<2:59:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3793/10070 [1:48:15<2:59:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3793/10070 [1:48:15<2:59:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3794/10070 [1:48:17<2:59:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3794/10070 [1:48:17<2:59:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3795/10070 [1:48:18<2:59:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3795/10070 [1:48:18<2:59:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3796/10070 [1:48:21<2:59:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3796/10070 [1:48:21<2:59:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3797/10070 [1:48:22<2:59:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3797/10070 [1:48:22<2:59:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3798/10070 [1:48:23<2:59:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3798/10070 [1:48:23<2:59:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3799/10070 [1:48:26<2:58:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3799/10070 [1:48:26<2:58:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3800/10070 [1:48:26<2:58:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3800/10070 [1:48:26<2:58:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3801/10070 [1:48:27<2:58:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3801/10070 [1:48:27<2:58:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3802/10070 [1:48:28<2:58:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3802/10070 [1:48:28<2:58:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3803/10070 [1:48:30<2:58:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3803/10070 [1:48:30<2:58:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3804/10070 [1:48:31<2:58:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3804/10070 [1:48:31<2:58:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3805/10070 [1:48:32<2:58:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3805/10070 [1:48:32<2:58:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3806/10070 [1:48:33<2:58:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3806/10070 [1:48:33<2:58:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3807/10070 [1:48:34<2:58:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3807/10070 [1:48:34<2:58:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3808/10070 [1:48:41<2:58:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3808/10070 [1:48:41<2:58:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3809/10070 [1:48:43<2:58:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3809/10070 [1:48:43<2:58:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3810/10070 [1:48:45<2:58:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3810/10070 [1:48:45<2:58:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3811/10070 [1:48:46<2:58:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3811/10070 [1:48:46<2:58:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3812/10070 [1:48:47<2:58:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3812/10070 [1:48:47<2:58:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3813/10070 [1:48:48<2:58:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3813/10070 [1:48:48<2:58:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3814/10070 [1:48:50<2:58:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3814/10070 [1:48:50<2:58:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3815/10070 [1:48:51<2:58:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3815/10070 [1:48:51<2:58:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3816/10070 [1:48:52<2:58:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3816/10070 [1:48:52<2:58:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3817/10070 [1:48:54<2:58:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3817/10070 [1:48:54<2:58:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3818/10070 [1:48:56<2:58:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3818/10070 [1:48:56<2:58:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3819/10070 [1:48:57<2:58:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3819/10070 [1:48:57<2:58:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3820/10070 [1:48:59<2:58:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3820/10070 [1:48:59<2:58:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3821/10070 [1:49:01<2:58:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3821/10070 [1:49:01<2:58:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3822/10070 [1:49:03<2:58:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3822/10070 [1:49:03<2:58:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3823/10070 [1:49:04<2:58:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3823/10070 [1:49:04<2:58:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3824/10070 [1:49:06<2:58:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3824/10070 [1:49:06<2:58:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3825/10070 [1:49:07<2:58:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3825/10070 [1:49:07<2:58:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3826/10070 [1:49:08<2:58:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3826/10070 [1:49:08<2:58:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3827/10070 [1:49:09<2:58:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3827/10070 [1:49:09<2:58:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3828/10070 [1:49:10<2:58:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3828/10070 [1:49:10<2:58:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3829/10070 [1:49:12<2:57:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3829/10070 [1:49:12<2:57:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3830/10070 [1:49:13<2:57:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3830/10070 [1:49:13<2:57:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3831/10070 [1:49:16<2:57:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3831/10070 [1:49:16<2:57:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3832/10070 [1:49:17<2:57:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3832/10070 [1:49:17<2:57:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3833/10070 [1:49:17<2:57:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3833/10070 [1:49:17<2:57:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3834/10070 [1:49:18<2:57:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3834/10070 [1:49:18<2:57:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3835/10070 [1:49:19<2:57:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3835/10070 [1:49:19<2:57:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3836/10070 [1:49:20<2:57:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3836/10070 [1:49:20<2:57:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3837/10070 [1:49:21<2:57:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3837/10070 [1:49:21<2:57:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3838/10070 [1:49:23<2:57:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3838/10070 [1:49:23<2:57:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3839/10070 [1:49:24<2:57:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3839/10070 [1:49:24<2:57:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3840/10070 [1:49:35<2:57:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3840/10070 [1:49:35<2:57:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3841/10070 [1:49:36<2:57:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3841/10070 [1:49:36<2:57:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3842/10070 [1:49:37<2:57:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3842/10070 [1:49:37<2:57:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3843/10070 [1:49:38<2:57:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3843/10070 [1:49:38<2:57:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3844/10070 [1:49:39<2:57:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3844/10070 [1:49:39<2:57:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3845/10070 [1:49:41<2:57:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3845/10070 [1:49:41<2:57:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3846/10070 [1:49:43<2:57:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3846/10070 [1:49:43<2:57:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3847/10070 [1:49:45<2:57:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3847/10070 [1:49:45<2:57:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3848/10070 [1:49:46<2:57:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3848/10070 [1:49:46<2:57:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3849/10070 [1:49:47<2:57:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3849/10070 [1:49:47<2:57:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3850/10070 [1:49:47<2:57:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3850/10070 [1:49:47<2:57:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3851/10070 [1:49:48<2:57:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3851/10070 [1:49:48<2:57:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3852/10070 [1:49:50<2:57:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3852/10070 [1:49:50<2:57:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3853/10070 [1:49:51<2:57:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3853/10070 [1:49:51<2:57:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3854/10070 [1:49:53<2:57:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3854/10070 [1:49:53<2:57:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3855/10070 [1:49:54<2:57:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3855/10070 [1:49:54<2:57:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3856/10070 [1:49:56<2:57:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3856/10070 [1:49:56<2:57:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3857/10070 [1:49:57<2:57:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3857/10070 [1:49:57<2:57:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3858/10070 [1:49:59<2:57:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3858/10070 [1:49:59<2:57:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3859/10070 [1:50:00<2:57:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3859/10070 [1:50:00<2:57:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3860/10070 [1:50:01<2:57:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3860/10070 [1:50:01<2:57:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3861/10070 [1:50:02<2:56:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3861/10070 [1:50:02<2:56:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3862/10070 [1:50:03<2:56:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3862/10070 [1:50:03<2:56:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3863/10070 [1:50:05<2:56:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3863/10070 [1:50:05<2:56:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3864/10070 [1:50:07<2:56:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3864/10070 [1:50:07<2:56:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3865/10070 [1:50:09<2:56:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3865/10070 [1:50:09<2:56:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3866/10070 [1:50:10<2:56:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3866/10070 [1:50:10<2:56:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3867/10070 [1:50:12<2:56:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3867/10070 [1:50:12<2:56:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3868/10070 [1:50:14<2:56:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3868/10070 [1:50:14<2:56:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3869/10070 [1:50:16<2:56:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3869/10070 [1:50:16<2:56:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3870/10070 [1:50:17<2:56:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3870/10070 [1:50:17<2:56:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3871/10070 [1:50:17<2:56:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3871/10070 [1:50:17<2:56:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3872/10070 [1:50:28<2:56:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3872/10070 [1:50:28<2:56:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3873/10070 [1:50:29<2:56:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3873/10070 [1:50:29<2:56:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3874/10070 [1:50:29<2:56:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3874/10070 [1:50:29<2:56:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3875/10070 [1:50:30<2:56:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3875/10070 [1:50:30<2:56:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  38%|▍| 3876/10070 [1:50:32<2:56:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  38%|▍| 3876/10070 [1:50:32<2:56:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3877/10070 [1:50:33<2:56:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3877/10070 [1:50:33<2:56:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3878/10070 [1:50:35<2:56:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3878/10070 [1:50:35<2:56:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3879/10070 [1:50:37<2:56:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3879/10070 [1:50:37<2:56:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3880/10070 [1:50:39<2:56:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3880/10070 [1:50:39<2:56:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3881/10070 [1:50:40<2:56:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3881/10070 [1:50:40<2:56:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3882/10070 [1:50:42<2:56:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3882/10070 [1:50:42<2:56:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3883/10070 [1:50:44<2:56:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3883/10070 [1:50:44<2:56:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3884/10070 [1:50:45<2:56:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3884/10070 [1:50:45<2:56:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3885/10070 [1:50:47<2:56:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3885/10070 [1:50:47<2:56:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3886/10070 [1:50:48<2:56:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3886/10070 [1:50:48<2:56:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3887/10070 [1:50:49<2:56:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3887/10070 [1:50:49<2:56:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3888/10070 [1:50:51<2:56:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3888/10070 [1:50:51<2:56:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3889/10070 [1:50:53<2:56:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3889/10070 [1:50:53<2:56:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3890/10070 [1:50:55<2:56:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3890/10070 [1:50:55<2:56:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3891/10070 [1:50:57<2:56:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3891/10070 [1:50:57<2:56:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3892/10070 [1:50:59<2:56:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3892/10070 [1:50:59<2:56:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3893/10070 [1:51:01<2:56:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3893/10070 [1:51:01<2:56:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3894/10070 [1:51:01<2:56:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3894/10070 [1:51:01<2:56:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3895/10070 [1:51:03<2:56:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3895/10070 [1:51:03<2:56:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3896/10070 [1:51:04<2:56:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3896/10070 [1:51:04<2:56:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3897/10070 [1:51:05<2:55:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3897/10070 [1:51:05<2:55:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3898/10070 [1:51:07<2:55:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3898/10070 [1:51:07<2:55:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3899/10070 [1:51:08<2:55:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3899/10070 [1:51:08<2:55:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3900/10070 [1:51:09<2:55:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3900/10070 [1:51:09<2:55:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3901/10070 [1:51:10<2:55:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3901/10070 [1:51:10<2:55:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3902/10070 [1:51:11<2:55:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3902/10070 [1:51:11<2:55:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3903/10070 [1:51:13<2:55:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3903/10070 [1:51:13<2:55:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3904/10070 [1:51:20<2:55:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3904/10070 [1:51:20<2:55:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3905/10070 [1:51:22<2:55:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3905/10070 [1:51:22<2:55:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3906/10070 [1:51:23<2:55:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3906/10070 [1:51:23<2:55:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3907/10070 [1:51:24<2:55:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3907/10070 [1:51:24<2:55:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3908/10070 [1:51:26<2:55:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3908/10070 [1:51:26<2:55:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3909/10070 [1:51:26<2:55:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3909/10070 [1:51:26<2:55:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3910/10070 [1:51:28<2:55:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3910/10070 [1:51:28<2:55:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3911/10070 [1:51:28<2:55:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3911/10070 [1:51:28<2:55:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3912/10070 [1:51:30<2:55:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3912/10070 [1:51:30<2:55:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3913/10070 [1:51:33<2:55:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3913/10070 [1:51:33<2:55:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3914/10070 [1:51:33<2:55:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3914/10070 [1:51:33<2:55:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3915/10070 [1:51:34<2:55:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3915/10070 [1:51:34<2:55:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3916/10070 [1:51:36<2:55:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3916/10070 [1:51:36<2:55:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3917/10070 [1:51:38<2:55:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3917/10070 [1:51:38<2:55:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3918/10070 [1:51:39<2:55:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3918/10070 [1:51:39<2:55:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3919/10070 [1:51:40<2:55:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3919/10070 [1:51:40<2:55:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3920/10070 [1:51:41<2:55:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3920/10070 [1:51:41<2:55:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3921/10070 [1:51:43<2:55:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3921/10070 [1:51:43<2:55:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3922/10070 [1:51:43<2:55:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3922/10070 [1:51:43<2:55:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3923/10070 [1:51:45<2:55:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3923/10070 [1:51:45<2:55:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3924/10070 [1:51:46<2:55:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3924/10070 [1:51:46<2:55:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3925/10070 [1:51:48<2:55:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3925/10070 [1:51:48<2:55:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3926/10070 [1:51:51<2:55:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3926/10070 [1:51:51<2:55:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3927/10070 [1:51:51<2:54:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3927/10070 [1:51:51<2:54:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3928/10070 [1:51:53<2:54:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3928/10070 [1:51:53<2:54:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3929/10070 [1:51:56<2:54:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3929/10070 [1:51:56<2:54:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3930/10070 [1:51:57<2:54:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3930/10070 [1:51:57<2:54:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3931/10070 [1:51:59<2:54:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3931/10070 [1:51:59<2:54:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3932/10070 [1:52:00<2:54:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3932/10070 [1:52:00<2:54:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3933/10070 [1:52:01<2:54:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3933/10070 [1:52:01<2:54:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3934/10070 [1:52:03<2:54:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3934/10070 [1:52:03<2:54:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3935/10070 [1:52:04<2:54:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3935/10070 [1:52:04<2:54:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3936/10070 [1:52:13<2:54:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3936/10070 [1:52:13<2:54:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3937/10070 [1:52:14<2:54:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3937/10070 [1:52:14<2:54:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3938/10070 [1:52:14<2:54:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3938/10070 [1:52:14<2:54:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3939/10070 [1:52:15<2:54:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3939/10070 [1:52:15<2:54:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3940/10070 [1:52:16<2:54:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3940/10070 [1:52:16<2:54:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3941/10070 [1:52:16<2:54:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3941/10070 [1:52:16<2:54:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3942/10070 [1:52:19<2:54:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3942/10070 [1:52:19<2:54:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3943/10070 [1:52:20<2:54:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3943/10070 [1:52:20<2:54:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3944/10070 [1:52:20<2:54:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3944/10070 [1:52:20<2:54:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3945/10070 [1:52:21<2:54:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3945/10070 [1:52:21<2:54:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3946/10070 [1:52:22<2:54:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3946/10070 [1:52:22<2:54:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3947/10070 [1:52:23<2:54:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3947/10070 [1:52:23<2:54:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3948/10070 [1:52:24<2:54:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3948/10070 [1:52:24<2:54:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3949/10070 [1:52:27<2:54:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3949/10070 [1:52:27<2:54:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3950/10070 [1:52:28<2:54:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3950/10070 [1:52:28<2:54:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3951/10070 [1:52:29<2:54:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3951/10070 [1:52:29<2:54:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3952/10070 [1:52:31<2:54:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3952/10070 [1:52:31<2:54:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3953/10070 [1:52:33<2:54:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3953/10070 [1:52:33<2:54:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3954/10070 [1:52:35<2:54:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3954/10070 [1:52:35<2:54:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3955/10070 [1:52:35<2:54:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3955/10070 [1:52:35<2:54:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3956/10070 [1:52:37<2:54:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3956/10070 [1:52:37<2:54:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3957/10070 [1:52:38<2:54:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3957/10070 [1:52:38<2:54:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3958/10070 [1:52:40<2:53:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3958/10070 [1:52:40<2:53:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3959/10070 [1:52:42<2:53:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3959/10070 [1:52:42<2:53:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3960/10070 [1:52:44<2:53:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3960/10070 [1:52:44<2:53:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3961/10070 [1:52:45<2:53:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3961/10070 [1:52:45<2:53:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3962/10070 [1:52:47<2:53:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3962/10070 [1:52:47<2:53:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3963/10070 [1:52:48<2:53:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3963/10070 [1:52:48<2:53:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3964/10070 [1:52:49<2:53:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3964/10070 [1:52:49<2:53:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3965/10070 [1:52:50<2:53:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3965/10070 [1:52:50<2:53:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3966/10070 [1:52:51<2:53:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3966/10070 [1:52:51<2:53:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3967/10070 [1:52:52<2:53:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3967/10070 [1:52:52<2:53:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3968/10070 [1:53:07<2:53:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3968/10070 [1:53:07<2:53:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3969/10070 [1:53:08<2:53:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3969/10070 [1:53:08<2:53:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3970/10070 [1:53:09<2:53:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3970/10070 [1:53:09<2:53:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3971/10070 [1:53:11<2:53:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3971/10070 [1:53:11<2:53:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3972/10070 [1:53:12<2:53:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3972/10070 [1:53:12<2:53:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3973/10070 [1:53:14<2:53:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3973/10070 [1:53:14<2:53:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3974/10070 [1:53:15<2:53:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3974/10070 [1:53:15<2:53:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3975/10070 [1:53:16<2:53:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3975/10070 [1:53:16<2:53:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3976/10070 [1:53:18<2:53:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3976/10070 [1:53:18<2:53:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  39%|▍| 3977/10070 [1:53:20<2:53:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  39%|▍| 3977/10070 [1:53:20<2:53:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3978/10070 [1:53:23<2:53:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3978/10070 [1:53:23<2:53:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3979/10070 [1:53:25<2:53:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3979/10070 [1:53:25<2:53:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3980/10070 [1:53:26<2:53:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3980/10070 [1:53:26<2:53:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3981/10070 [1:53:28<2:53:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3981/10070 [1:53:28<2:53:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3982/10070 [1:53:29<2:53:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3982/10070 [1:53:29<2:53:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3983/10070 [1:53:31<2:53:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3983/10070 [1:53:31<2:53:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3984/10070 [1:53:33<2:53:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3984/10070 [1:53:33<2:53:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3985/10070 [1:53:35<2:53:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3985/10070 [1:53:35<2:53:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3986/10070 [1:53:36<2:53:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3986/10070 [1:53:36<2:53:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3987/10070 [1:53:38<2:53:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3987/10070 [1:53:38<2:53:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3988/10070 [1:53:40<2:53:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3988/10070 [1:53:40<2:53:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3989/10070 [1:53:42<2:53:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3989/10070 [1:53:42<2:53:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3990/10070 [1:53:42<2:53:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3990/10070 [1:53:42<2:53:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3991/10070 [1:53:45<2:53:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3991/10070 [1:53:45<2:53:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3992/10070 [1:53:45<2:53:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3992/10070 [1:53:45<2:53:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3993/10070 [1:53:47<2:53:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3993/10070 [1:53:47<2:53:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3994/10070 [1:53:49<2:53:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3994/10070 [1:53:49<2:53:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3995/10070 [1:53:49<2:53:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3995/10070 [1:53:49<2:53:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3996/10070 [1:53:51<2:53:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3996/10070 [1:53:51<2:53:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3997/10070 [1:53:53<2:53:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3997/10070 [1:53:53<2:53:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3998/10070 [1:53:54<2:52:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3998/10070 [1:53:54<2:52:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 3999/10070 [1:53:54<2:52:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 3999/10070 [1:53:54<2:52:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4000/10070 [1:54:01<2:53:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4000/10070 [1:54:01<2:53:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4001/10070 [1:54:23<2:53:30,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4001/10070 [1:54:23<2:53:30,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4002/10070 [1:54:24<2:53:28,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4002/10070 [1:54:24<2:53:28,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4003/10070 [1:54:26<2:53:26,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4003/10070 [1:54:26<2:53:26,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4004/10070 [1:54:26<2:53:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4004/10070 [1:54:26<2:53:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4005/10070 [1:54:27<2:53:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4005/10070 [1:54:27<2:53:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4006/10070 [1:54:28<2:53:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4006/10070 [1:54:28<2:53:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4007/10070 [1:54:30<2:53:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4007/10070 [1:54:30<2:53:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4008/10070 [1:54:32<2:53:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4008/10070 [1:54:32<2:53:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4009/10070 [1:54:34<2:53:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4009/10070 [1:54:34<2:53:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4010/10070 [1:54:35<2:53:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4010/10070 [1:54:35<2:53:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4011/10070 [1:54:36<2:53:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4011/10070 [1:54:36<2:53:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4012/10070 [1:54:38<2:53:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4012/10070 [1:54:38<2:53:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4013/10070 [1:54:40<2:53:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4013/10070 [1:54:40<2:53:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4014/10070 [1:54:42<2:53:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4014/10070 [1:54:42<2:53:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4015/10070 [1:54:44<2:53:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4015/10070 [1:54:44<2:53:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4016/10070 [1:54:47<2:53:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4016/10070 [1:54:47<2:53:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4017/10070 [1:54:48<2:53:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4017/10070 [1:54:48<2:53:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4018/10070 [1:54:49<2:52:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4018/10070 [1:54:49<2:52:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4019/10070 [1:54:50<2:52:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4019/10070 [1:54:50<2:52:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4020/10070 [1:54:51<2:52:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4020/10070 [1:54:51<2:52:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4021/10070 [1:54:52<2:52:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4021/10070 [1:54:52<2:52:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4022/10070 [1:54:54<2:52:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4022/10070 [1:54:54<2:52:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4023/10070 [1:54:55<2:52:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4023/10070 [1:54:55<2:52:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4024/10070 [1:54:56<2:52:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4024/10070 [1:54:56<2:52:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4025/10070 [1:54:56<2:52:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4025/10070 [1:54:56<2:52:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4026/10070 [1:54:57<2:52:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4026/10070 [1:54:57<2:52:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4027/10070 [1:54:58<2:52:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4027/10070 [1:54:58<2:52:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4028/10070 [1:55:00<2:52:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4028/10070 [1:55:00<2:52:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4029/10070 [1:55:02<2:52:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4029/10070 [1:55:02<2:52:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4030/10070 [1:55:03<2:52:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4030/10070 [1:55:03<2:52:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4031/10070 [1:55:04<2:52:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4031/10070 [1:55:04<2:52:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4032/10070 [1:55:14<2:52:35,  1.72s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4032/10070 [1:55:14<2:52:35,  1.72s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4033/10070 [1:55:16<2:52:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4033/10070 [1:55:16<2:52:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4034/10070 [1:55:17<2:52:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4034/10070 [1:55:17<2:52:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4035/10070 [1:55:19<2:52:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4035/10070 [1:55:19<2:52:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4036/10070 [1:55:21<2:52:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4036/10070 [1:55:21<2:52:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4037/10070 [1:55:21<2:52:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4037/10070 [1:55:21<2:52:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4038/10070 [1:55:23<2:52:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4038/10070 [1:55:23<2:52:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4039/10070 [1:55:24<2:52:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4039/10070 [1:55:24<2:52:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4040/10070 [1:55:25<2:52:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4040/10070 [1:55:25<2:52:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4041/10070 [1:55:26<2:52:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4041/10070 [1:55:26<2:52:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4042/10070 [1:55:27<2:52:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4042/10070 [1:55:27<2:52:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4043/10070 [1:55:28<2:52:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4043/10070 [1:55:28<2:52:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4044/10070 [1:55:29<2:52:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4044/10070 [1:55:29<2:52:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4045/10070 [1:55:29<2:52:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4045/10070 [1:55:29<2:52:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4046/10070 [1:55:30<2:51:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4046/10070 [1:55:30<2:51:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4047/10070 [1:55:31<2:51:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4047/10070 [1:55:31<2:51:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4048/10070 [1:55:31<2:51:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4048/10070 [1:55:31<2:51:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4049/10070 [1:55:32<2:51:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4049/10070 [1:55:32<2:51:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4050/10070 [1:55:34<2:51:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4050/10070 [1:55:34<2:51:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4051/10070 [1:55:35<2:51:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4051/10070 [1:55:35<2:51:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4052/10070 [1:55:36<2:51:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4052/10070 [1:55:36<2:51:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4053/10070 [1:55:38<2:51:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4053/10070 [1:55:38<2:51:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4054/10070 [1:55:39<2:51:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4054/10070 [1:55:39<2:51:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4055/10070 [1:55:40<2:51:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4055/10070 [1:55:40<2:51:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4056/10070 [1:55:40<2:51:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4056/10070 [1:55:40<2:51:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4057/10070 [1:55:41<2:51:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4057/10070 [1:55:41<2:51:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4058/10070 [1:55:43<2:51:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4058/10070 [1:55:43<2:51:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4059/10070 [1:55:45<2:51:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4059/10070 [1:55:45<2:51:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4060/10070 [1:55:47<2:51:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4060/10070 [1:55:47<2:51:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4061/10070 [1:55:48<2:51:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4061/10070 [1:55:48<2:51:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4062/10070 [1:55:49<2:51:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4062/10070 [1:55:49<2:51:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4063/10070 [1:55:50<2:51:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4063/10070 [1:55:50<2:51:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4064/10070 [1:56:09<2:51:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4064/10070 [1:56:09<2:51:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4065/10070 [1:56:09<2:51:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4065/10070 [1:56:09<2:51:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4066/10070 [1:56:11<2:51:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4066/10070 [1:56:11<2:51:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4067/10070 [1:56:13<2:51:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4067/10070 [1:56:13<2:51:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4068/10070 [1:56:16<2:51:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4068/10070 [1:56:16<2:51:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4069/10070 [1:56:17<2:51:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4069/10070 [1:56:17<2:51:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4070/10070 [1:56:18<2:51:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4070/10070 [1:56:18<2:51:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4071/10070 [1:56:20<2:51:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4071/10070 [1:56:20<2:51:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4072/10070 [1:56:21<2:51:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4072/10070 [1:56:21<2:51:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4073/10070 [1:56:22<2:51:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4073/10070 [1:56:22<2:51:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4074/10070 [1:56:24<2:51:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4074/10070 [1:56:24<2:51:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4075/10070 [1:56:25<2:51:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4075/10070 [1:56:25<2:51:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4076/10070 [1:56:27<2:51:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4076/10070 [1:56:27<2:51:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4077/10070 [1:56:28<2:51:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4077/10070 [1:56:28<2:51:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  40%|▍| 4078/10070 [1:56:29<2:51:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  40%|▍| 4078/10070 [1:56:29<2:51:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4079/10070 [1:56:31<2:51:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4079/10070 [1:56:31<2:51:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4080/10070 [1:56:32<2:51:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4080/10070 [1:56:32<2:51:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4081/10070 [1:56:34<2:51:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4081/10070 [1:56:34<2:51:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4082/10070 [1:56:36<2:51:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4082/10070 [1:56:36<2:51:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4083/10070 [1:56:36<2:50:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4083/10070 [1:56:36<2:50:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4084/10070 [1:56:37<2:50:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4084/10070 [1:56:37<2:50:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4085/10070 [1:56:38<2:50:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4085/10070 [1:56:38<2:50:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4086/10070 [1:56:40<2:50:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4086/10070 [1:56:40<2:50:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4087/10070 [1:56:41<2:50:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4087/10070 [1:56:41<2:50:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4088/10070 [1:56:43<2:50:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4088/10070 [1:56:43<2:50:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4089/10070 [1:56:44<2:50:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4089/10070 [1:56:44<2:50:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4090/10070 [1:56:46<2:50:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4090/10070 [1:56:46<2:50:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4091/10070 [1:56:48<2:50:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4091/10070 [1:56:48<2:50:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4092/10070 [1:56:49<2:50:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4092/10070 [1:56:49<2:50:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4093/10070 [1:56:51<2:50:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4093/10070 [1:56:51<2:50:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4094/10070 [1:56:53<2:50:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4094/10070 [1:56:53<2:50:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4095/10070 [1:56:54<2:50:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4095/10070 [1:56:54<2:50:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4096/10070 [1:57:04<2:50:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4096/10070 [1:57:04<2:50:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4097/10070 [1:57:05<2:50:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4097/10070 [1:57:05<2:50:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4098/10070 [1:57:05<2:50:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4098/10070 [1:57:05<2:50:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4099/10070 [1:57:07<2:50:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4099/10070 [1:57:07<2:50:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4100/10070 [1:57:08<2:50:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4100/10070 [1:57:08<2:50:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4101/10070 [1:57:11<2:50:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4101/10070 [1:57:11<2:50:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4102/10070 [1:57:12<2:50:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4102/10070 [1:57:12<2:50:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4103/10070 [1:57:13<2:50:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4103/10070 [1:57:13<2:50:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4104/10070 [1:57:14<2:50:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4104/10070 [1:57:14<2:50:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4105/10070 [1:57:15<2:50:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4105/10070 [1:57:15<2:50:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4106/10070 [1:57:16<2:50:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4106/10070 [1:57:16<2:50:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4107/10070 [1:57:18<2:50:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4107/10070 [1:57:18<2:50:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4108/10070 [1:57:19<2:50:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4108/10070 [1:57:19<2:50:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4109/10070 [1:57:20<2:50:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4109/10070 [1:57:20<2:50:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4110/10070 [1:57:22<2:50:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4110/10070 [1:57:22<2:50:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4111/10070 [1:57:23<2:50:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4111/10070 [1:57:23<2:50:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4112/10070 [1:57:25<2:50:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4112/10070 [1:57:25<2:50:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4113/10070 [1:57:25<2:50:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4113/10070 [1:57:25<2:50:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4114/10070 [1:57:28<2:50:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4114/10070 [1:57:28<2:50:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4115/10070 [1:57:29<2:50:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4115/10070 [1:57:29<2:50:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4116/10070 [1:57:31<2:50:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4116/10070 [1:57:31<2:50:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4117/10070 [1:57:32<2:49:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4117/10070 [1:57:32<2:49:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4118/10070 [1:57:32<2:49:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4118/10070 [1:57:32<2:49:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4119/10070 [1:57:34<2:49:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4119/10070 [1:57:34<2:49:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4120/10070 [1:57:35<2:49:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4120/10070 [1:57:35<2:49:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4121/10070 [1:57:36<2:49:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4121/10070 [1:57:36<2:49:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4122/10070 [1:57:38<2:49:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4122/10070 [1:57:38<2:49:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4123/10070 [1:57:40<2:49:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4123/10070 [1:57:40<2:49:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4124/10070 [1:57:42<2:49:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4124/10070 [1:57:42<2:49:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4125/10070 [1:57:43<2:49:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4125/10070 [1:57:43<2:49:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4126/10070 [1:57:44<2:49:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4126/10070 [1:57:44<2:49:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4127/10070 [1:57:45<2:49:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4127/10070 [1:57:45<2:49:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4128/10070 [1:57:58<2:49:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4128/10070 [1:57:58<2:49:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4129/10070 [1:57:59<2:49:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4129/10070 [1:57:59<2:49:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4130/10070 [1:58:00<2:49:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4130/10070 [1:58:00<2:49:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4131/10070 [1:58:02<2:49:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4131/10070 [1:58:02<2:49:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4132/10070 [1:58:03<2:49:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4132/10070 [1:58:03<2:49:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4133/10070 [1:58:03<2:49:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4133/10070 [1:58:03<2:49:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4134/10070 [1:58:06<2:49:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4134/10070 [1:58:06<2:49:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4135/10070 [1:58:07<2:49:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4135/10070 [1:58:07<2:49:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4136/10070 [1:58:08<2:49:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4136/10070 [1:58:08<2:49:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4137/10070 [1:58:09<2:49:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4137/10070 [1:58:09<2:49:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4138/10070 [1:58:11<2:49:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4138/10070 [1:58:11<2:49:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4139/10070 [1:58:12<2:49:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4139/10070 [1:58:12<2:49:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4140/10070 [1:58:12<2:49:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4140/10070 [1:58:12<2:49:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4141/10070 [1:58:14<2:49:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4141/10070 [1:58:14<2:49:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4142/10070 [1:58:16<2:49:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4142/10070 [1:58:16<2:49:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4143/10070 [1:58:18<2:49:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4143/10070 [1:58:18<2:49:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4144/10070 [1:58:19<2:49:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4144/10070 [1:58:19<2:49:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4145/10070 [1:58:21<2:49:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4145/10070 [1:58:21<2:49:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4146/10070 [1:58:22<2:49:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4146/10070 [1:58:22<2:49:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4147/10070 [1:58:24<2:49:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4147/10070 [1:58:24<2:49:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4148/10070 [1:58:25<2:49:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4148/10070 [1:58:25<2:49:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4149/10070 [1:58:26<2:49:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4149/10070 [1:58:26<2:49:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4150/10070 [1:58:29<2:49:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4150/10070 [1:58:29<2:49:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4151/10070 [1:58:29<2:48:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4151/10070 [1:58:29<2:48:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4152/10070 [1:58:31<2:48:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4152/10070 [1:58:31<2:48:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4153/10070 [1:58:32<2:48:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4153/10070 [1:58:32<2:48:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4154/10070 [1:58:34<2:48:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4154/10070 [1:58:34<2:48:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4155/10070 [1:58:35<2:48:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4155/10070 [1:58:35<2:48:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4156/10070 [1:58:36<2:48:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4156/10070 [1:58:36<2:48:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4157/10070 [1:58:37<2:48:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4157/10070 [1:58:37<2:48:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4158/10070 [1:58:39<2:48:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4158/10070 [1:58:39<2:48:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4159/10070 [1:58:39<2:48:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4159/10070 [1:58:39<2:48:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4160/10070 [1:58:48<2:48:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4160/10070 [1:58:48<2:48:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4161/10070 [1:58:49<2:48:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4161/10070 [1:58:49<2:48:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4162/10070 [1:58:51<2:48:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4162/10070 [1:58:51<2:48:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4163/10070 [1:58:52<2:48:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4163/10070 [1:58:52<2:48:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4164/10070 [1:58:54<2:48:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4164/10070 [1:58:54<2:48:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4165/10070 [1:58:56<2:48:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4165/10070 [1:58:56<2:48:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4166/10070 [1:58:57<2:48:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4166/10070 [1:58:57<2:48:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4167/10070 [1:58:59<2:48:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4167/10070 [1:58:59<2:48:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4168/10070 [1:59:00<2:48:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4168/10070 [1:59:00<2:48:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4169/10070 [1:59:02<2:48:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4169/10070 [1:59:02<2:48:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4170/10070 [1:59:03<2:48:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4170/10070 [1:59:03<2:48:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4171/10070 [1:59:04<2:48:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4171/10070 [1:59:04<2:48:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4172/10070 [1:59:05<2:48:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4172/10070 [1:59:05<2:48:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4173/10070 [1:59:06<2:48:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4173/10070 [1:59:06<2:48:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4174/10070 [1:59:06<2:48:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4174/10070 [1:59:06<2:48:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4175/10070 [1:59:07<2:48:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4175/10070 [1:59:07<2:48:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4176/10070 [1:59:08<2:48:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4176/10070 [1:59:08<2:48:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4177/10070 [1:59:08<2:48:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4177/10070 [1:59:08<2:48:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4178/10070 [1:59:10<2:48:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4178/10070 [1:59:10<2:48:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  41%|▍| 4179/10070 [1:59:12<2:48:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  41%|▍| 4179/10070 [1:59:12<2:48:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4180/10070 [1:59:12<2:47:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4180/10070 [1:59:12<2:47:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4181/10070 [1:59:14<2:47:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4181/10070 [1:59:14<2:47:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4182/10070 [1:59:15<2:47:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4182/10070 [1:59:15<2:47:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4183/10070 [1:59:16<2:47:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4183/10070 [1:59:16<2:47:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4184/10070 [1:59:18<2:47:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4184/10070 [1:59:18<2:47:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4185/10070 [1:59:20<2:47:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4185/10070 [1:59:20<2:47:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4186/10070 [1:59:22<2:47:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4186/10070 [1:59:22<2:47:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4187/10070 [1:59:24<2:47:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4187/10070 [1:59:24<2:47:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4188/10070 [1:59:24<2:47:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4188/10070 [1:59:24<2:47:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4189/10070 [1:59:26<2:47:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4189/10070 [1:59:26<2:47:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4190/10070 [1:59:27<2:47:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4190/10070 [1:59:27<2:47:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4191/10070 [1:59:29<2:47:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4191/10070 [1:59:29<2:47:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4192/10070 [1:59:41<2:47:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4192/10070 [1:59:41<2:47:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4193/10070 [1:59:41<2:47:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4193/10070 [1:59:41<2:47:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4194/10070 [1:59:43<2:47:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4194/10070 [1:59:43<2:47:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4195/10070 [1:59:44<2:47:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4195/10070 [1:59:44<2:47:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4196/10070 [1:59:46<2:47:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4196/10070 [1:59:46<2:47:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4197/10070 [1:59:48<2:47:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4197/10070 [1:59:48<2:47:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4198/10070 [1:59:50<2:47:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4198/10070 [1:59:50<2:47:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4199/10070 [1:59:51<2:47:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4199/10070 [1:59:51<2:47:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4200/10070 [1:59:53<2:47:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4200/10070 [1:59:53<2:47:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4201/10070 [1:59:54<2:47:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4201/10070 [1:59:54<2:47:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4202/10070 [1:59:55<2:47:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4202/10070 [1:59:55<2:47:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4203/10070 [1:59:57<2:47:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4203/10070 [1:59:57<2:47:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4204/10070 [1:59:59<2:47:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4204/10070 [1:59:59<2:47:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4205/10070 [2:00:00<2:47:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4205/10070 [2:00:00<2:47:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4206/10070 [2:00:01<2:47:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4206/10070 [2:00:01<2:47:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4207/10070 [2:00:02<2:47:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4207/10070 [2:00:02<2:47:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4208/10070 [2:00:03<2:47:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4208/10070 [2:00:03<2:47:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4209/10070 [2:00:03<2:47:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4209/10070 [2:00:03<2:47:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4210/10070 [2:00:04<2:47:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4210/10070 [2:00:04<2:47:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4211/10070 [2:00:06<2:47:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4211/10070 [2:00:06<2:47:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4212/10070 [2:00:06<2:47:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4212/10070 [2:00:06<2:47:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4213/10070 [2:00:08<2:47:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4213/10070 [2:00:08<2:47:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4214/10070 [2:00:10<2:47:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4214/10070 [2:00:10<2:47:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4215/10070 [2:00:12<2:46:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4215/10070 [2:00:12<2:46:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4216/10070 [2:00:12<2:46:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4216/10070 [2:00:12<2:46:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4217/10070 [2:00:13<2:46:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4217/10070 [2:00:13<2:46:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4218/10070 [2:00:14<2:46:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4218/10070 [2:00:14<2:46:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4219/10070 [2:00:15<2:46:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4219/10070 [2:00:15<2:46:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4220/10070 [2:00:17<2:46:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4220/10070 [2:00:17<2:46:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4221/10070 [2:00:18<2:46:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4221/10070 [2:00:18<2:46:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4222/10070 [2:00:19<2:46:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4222/10070 [2:00:19<2:46:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4223/10070 [2:00:20<2:46:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4223/10070 [2:00:20<2:46:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4224/10070 [2:00:33<2:46:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4224/10070 [2:00:33<2:46:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4225/10070 [2:00:34<2:46:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4225/10070 [2:00:34<2:46:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4226/10070 [2:00:36<2:46:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4226/10070 [2:00:36<2:46:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4227/10070 [2:00:38<2:46:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4227/10070 [2:00:38<2:46:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4228/10070 [2:00:39<2:46:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4228/10070 [2:00:39<2:46:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4229/10070 [2:00:40<2:46:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4229/10070 [2:00:40<2:46:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4230/10070 [2:00:41<2:46:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4230/10070 [2:00:41<2:46:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4231/10070 [2:00:41<2:46:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4231/10070 [2:00:41<2:46:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4232/10070 [2:00:42<2:46:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4232/10070 [2:00:42<2:46:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4233/10070 [2:00:43<2:46:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4233/10070 [2:00:43<2:46:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4234/10070 [2:00:43<2:46:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4234/10070 [2:00:43<2:46:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4235/10070 [2:00:44<2:46:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4235/10070 [2:00:44<2:46:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4236/10070 [2:00:45<2:46:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4236/10070 [2:00:45<2:46:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4237/10070 [2:00:47<2:46:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4237/10070 [2:00:47<2:46:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4238/10070 [2:00:48<2:46:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4238/10070 [2:00:48<2:46:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4239/10070 [2:00:50<2:46:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4239/10070 [2:00:50<2:46:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4240/10070 [2:00:51<2:46:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4240/10070 [2:00:51<2:46:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4241/10070 [2:00:52<2:46:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4241/10070 [2:00:52<2:46:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4242/10070 [2:00:53<2:46:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4242/10070 [2:00:53<2:46:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4243/10070 [2:00:55<2:46:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4243/10070 [2:00:55<2:46:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4244/10070 [2:00:57<2:46:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4244/10070 [2:00:57<2:46:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4245/10070 [2:00:58<2:45:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4245/10070 [2:00:58<2:45:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4246/10070 [2:00:59<2:45:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4246/10070 [2:00:59<2:45:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4247/10070 [2:01:00<2:45:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4247/10070 [2:01:00<2:45:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4248/10070 [2:01:01<2:45:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4248/10070 [2:01:01<2:45:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4249/10070 [2:01:03<2:45:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4249/10070 [2:01:03<2:45:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4250/10070 [2:01:04<2:45:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4250/10070 [2:01:04<2:45:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4251/10070 [2:01:06<2:45:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4251/10070 [2:01:06<2:45:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4252/10070 [2:01:06<2:45:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4252/10070 [2:01:07<2:45:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4253/10070 [2:01:08<2:45:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4253/10070 [2:01:08<2:45:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4254/10070 [2:01:10<2:45:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4254/10070 [2:01:10<2:45:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4255/10070 [2:01:13<2:45:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4255/10070 [2:01:13<2:45:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4256/10070 [2:01:25<2:45:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4256/10070 [2:01:25<2:45:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4257/10070 [2:01:27<2:45:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4257/10070 [2:01:27<2:45:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4258/10070 [2:01:27<2:45:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4258/10070 [2:01:27<2:45:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4259/10070 [2:01:29<2:45:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4259/10070 [2:01:29<2:45:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4260/10070 [2:01:30<2:45:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4260/10070 [2:01:30<2:45:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4261/10070 [2:01:32<2:45:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4261/10070 [2:01:32<2:45:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4262/10070 [2:01:33<2:45:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4262/10070 [2:01:33<2:45:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4263/10070 [2:01:35<2:45:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4263/10070 [2:01:35<2:45:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4264/10070 [2:01:35<2:45:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4264/10070 [2:01:35<2:45:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4265/10070 [2:01:36<2:45:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4265/10070 [2:01:36<2:45:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4266/10070 [2:01:38<2:45:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4266/10070 [2:01:38<2:45:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4267/10070 [2:01:40<2:45:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4267/10070 [2:01:40<2:45:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4268/10070 [2:01:40<2:45:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4268/10070 [2:01:40<2:45:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4269/10070 [2:01:42<2:45:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4269/10070 [2:01:42<2:45:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4270/10070 [2:01:43<2:45:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4270/10070 [2:01:43<2:45:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4271/10070 [2:01:45<2:45:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4271/10070 [2:01:45<2:45:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4272/10070 [2:01:46<2:45:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4272/10070 [2:01:46<2:45:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4273/10070 [2:01:46<2:45:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4273/10070 [2:01:46<2:45:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4274/10070 [2:01:48<2:45:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4274/10070 [2:01:48<2:45:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4275/10070 [2:01:48<2:45:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4275/10070 [2:01:48<2:45:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4276/10070 [2:01:49<2:45:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4276/10070 [2:01:49<2:45:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4277/10070 [2:01:50<2:45:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4277/10070 [2:01:50<2:45:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4278/10070 [2:01:52<2:45:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4278/10070 [2:01:52<2:45:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  42%|▍| 4279/10070 [2:01:53<2:44:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  42%|▍| 4279/10070 [2:01:53<2:44:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4280/10070 [2:01:54<2:44:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4280/10070 [2:01:54<2:44:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4281/10070 [2:01:56<2:44:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4281/10070 [2:01:56<2:44:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4282/10070 [2:01:57<2:44:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4282/10070 [2:01:57<2:44:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4283/10070 [2:01:58<2:44:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4283/10070 [2:01:58<2:44:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4284/10070 [2:02:00<2:44:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4284/10070 [2:02:00<2:44:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4285/10070 [2:02:01<2:44:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4285/10070 [2:02:01<2:44:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4286/10070 [2:02:03<2:44:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4286/10070 [2:02:03<2:44:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4287/10070 [2:02:05<2:44:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4287/10070 [2:02:05<2:44:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4288/10070 [2:02:18<2:44:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4288/10070 [2:02:18<2:44:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4289/10070 [2:02:19<2:44:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4289/10070 [2:02:19<2:44:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4290/10070 [2:02:20<2:44:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4290/10070 [2:02:20<2:44:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4291/10070 [2:02:21<2:44:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4291/10070 [2:02:21<2:44:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4292/10070 [2:02:23<2:44:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4292/10070 [2:02:23<2:44:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4293/10070 [2:02:23<2:44:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4293/10070 [2:02:23<2:44:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4294/10070 [2:02:24<2:44:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4294/10070 [2:02:24<2:44:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4295/10070 [2:02:26<2:44:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4295/10070 [2:02:26<2:44:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4296/10070 [2:02:26<2:44:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4296/10070 [2:02:26<2:44:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4297/10070 [2:02:28<2:44:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4297/10070 [2:02:28<2:44:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4298/10070 [2:02:29<2:44:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4298/10070 [2:02:29<2:44:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4299/10070 [2:02:31<2:44:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4299/10070 [2:02:31<2:44:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4300/10070 [2:02:32<2:44:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4300/10070 [2:02:32<2:44:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4301/10070 [2:02:34<2:44:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4301/10070 [2:02:34<2:44:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4302/10070 [2:02:35<2:44:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4302/10070 [2:02:35<2:44:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4303/10070 [2:02:36<2:44:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4303/10070 [2:02:36<2:44:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4304/10070 [2:02:37<2:44:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4304/10070 [2:02:37<2:44:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4305/10070 [2:02:38<2:44:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4305/10070 [2:02:38<2:44:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4306/10070 [2:02:40<2:44:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4306/10070 [2:02:40<2:44:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4307/10070 [2:02:42<2:44:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4307/10070 [2:02:42<2:44:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4308/10070 [2:02:44<2:44:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4308/10070 [2:02:44<2:44:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4309/10070 [2:02:44<2:44:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4309/10070 [2:02:44<2:44:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4310/10070 [2:02:46<2:44:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4310/10070 [2:02:46<2:44:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4311/10070 [2:02:47<2:44:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4311/10070 [2:02:47<2:44:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4312/10070 [2:02:48<2:43:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4312/10070 [2:02:48<2:43:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4313/10070 [2:02:51<2:43:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4313/10070 [2:02:51<2:43:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4314/10070 [2:02:51<2:43:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4314/10070 [2:02:51<2:43:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4315/10070 [2:02:52<2:43:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4315/10070 [2:02:52<2:43:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4316/10070 [2:02:54<2:43:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4316/10070 [2:02:54<2:43:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4317/10070 [2:02:55<2:43:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4317/10070 [2:02:55<2:43:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4318/10070 [2:02:57<2:43:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4318/10070 [2:02:57<2:43:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4319/10070 [2:02:59<2:43:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4319/10070 [2:02:59<2:43:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4320/10070 [2:03:12<2:44:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4320/10070 [2:03:12<2:44:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4321/10070 [2:03:14<2:43:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4321/10070 [2:03:14<2:43:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4322/10070 [2:03:16<2:43:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4322/10070 [2:03:16<2:43:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4323/10070 [2:03:18<2:43:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4323/10070 [2:03:18<2:43:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4324/10070 [2:03:19<2:43:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4324/10070 [2:03:19<2:43:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4325/10070 [2:03:19<2:43:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4325/10070 [2:03:19<2:43:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4326/10070 [2:03:20<2:43:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4326/10070 [2:03:20<2:43:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4327/10070 [2:03:22<2:43:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4327/10070 [2:03:22<2:43:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4328/10070 [2:03:25<2:43:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4328/10070 [2:03:25<2:43:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4329/10070 [2:03:26<2:43:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4329/10070 [2:03:26<2:43:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4330/10070 [2:03:27<2:43:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4330/10070 [2:03:27<2:43:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4331/10070 [2:03:29<2:43:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4331/10070 [2:03:29<2:43:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4332/10070 [2:03:30<2:43:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4332/10070 [2:03:30<2:43:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4333/10070 [2:03:30<2:43:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4333/10070 [2:03:30<2:43:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4334/10070 [2:03:32<2:43:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4334/10070 [2:03:32<2:43:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4335/10070 [2:03:33<2:43:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4335/10070 [2:03:33<2:43:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4336/10070 [2:03:34<2:43:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4336/10070 [2:03:34<2:43:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4337/10070 [2:03:36<2:43:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4337/10070 [2:03:36<2:43:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4338/10070 [2:03:37<2:43:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4338/10070 [2:03:37<2:43:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4339/10070 [2:03:39<2:43:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4339/10070 [2:03:39<2:43:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4340/10070 [2:03:39<2:43:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4340/10070 [2:03:39<2:43:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4341/10070 [2:03:41<2:43:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4341/10070 [2:03:41<2:43:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4342/10070 [2:03:43<2:43:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4342/10070 [2:03:43<2:43:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4343/10070 [2:03:46<2:43:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4343/10070 [2:03:46<2:43:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4344/10070 [2:03:46<2:43:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4344/10070 [2:03:46<2:43:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4345/10070 [2:03:47<2:43:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4345/10070 [2:03:47<2:43:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4346/10070 [2:03:49<2:43:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4346/10070 [2:03:49<2:43:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4347/10070 [2:03:50<2:43:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4347/10070 [2:03:50<2:43:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4348/10070 [2:03:53<2:43:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4348/10070 [2:03:53<2:43:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4349/10070 [2:03:55<2:43:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4349/10070 [2:03:55<2:43:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4350/10070 [2:03:57<2:43:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4350/10070 [2:03:57<2:43:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4351/10070 [2:03:58<2:42:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4351/10070 [2:03:58<2:42:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4352/10070 [2:04:09<2:43:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4352/10070 [2:04:09<2:43:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4353/10070 [2:04:11<2:43:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4353/10070 [2:04:11<2:43:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4354/10070 [2:04:11<2:43:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4354/10070 [2:04:11<2:43:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4355/10070 [2:04:13<2:43:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4355/10070 [2:04:13<2:43:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4356/10070 [2:04:14<2:42:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4356/10070 [2:04:14<2:42:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4357/10070 [2:04:15<2:42:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4357/10070 [2:04:15<2:42:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4358/10070 [2:04:17<2:42:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4358/10070 [2:04:17<2:42:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4359/10070 [2:04:18<2:42:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4359/10070 [2:04:18<2:42:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4360/10070 [2:04:18<2:42:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4360/10070 [2:04:18<2:42:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4361/10070 [2:04:19<2:42:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4361/10070 [2:04:19<2:42:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4362/10070 [2:04:20<2:42:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4362/10070 [2:04:20<2:42:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4363/10070 [2:04:21<2:42:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4363/10070 [2:04:21<2:42:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4364/10070 [2:04:23<2:42:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4364/10070 [2:04:23<2:42:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4365/10070 [2:04:23<2:42:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4365/10070 [2:04:23<2:42:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4366/10070 [2:04:25<2:42:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4366/10070 [2:04:25<2:42:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4367/10070 [2:04:26<2:42:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4367/10070 [2:04:26<2:42:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4368/10070 [2:04:27<2:42:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4368/10070 [2:04:27<2:42:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4369/10070 [2:04:29<2:42:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4369/10070 [2:04:29<2:42:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4370/10070 [2:04:30<2:42:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4370/10070 [2:04:30<2:42:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4371/10070 [2:04:31<2:42:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4371/10070 [2:04:31<2:42:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4372/10070 [2:04:33<2:42:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4372/10070 [2:04:33<2:42:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4373/10070 [2:04:35<2:42:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4373/10070 [2:04:35<2:42:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4374/10070 [2:04:37<2:42:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4374/10070 [2:04:37<2:42:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4375/10070 [2:04:39<2:42:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4375/10070 [2:04:39<2:42:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4376/10070 [2:04:41<2:42:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4376/10070 [2:04:41<2:42:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4377/10070 [2:04:42<2:42:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4377/10070 [2:04:42<2:42:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4378/10070 [2:04:43<2:42:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4378/10070 [2:04:43<2:42:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4379/10070 [2:04:44<2:42:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4379/10070 [2:04:44<2:42:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  43%|▍| 4380/10070 [2:04:45<2:42:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  43%|▍| 4380/10070 [2:04:45<2:42:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4381/10070 [2:04:46<2:42:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4381/10070 [2:04:46<2:42:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4382/10070 [2:04:47<2:41:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4382/10070 [2:04:47<2:41:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4383/10070 [2:04:49<2:41:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4383/10070 [2:04:49<2:41:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4384/10070 [2:04:59<2:42:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4384/10070 [2:04:59<2:42:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4385/10070 [2:05:00<2:42:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4385/10070 [2:05:00<2:42:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4386/10070 [2:05:02<2:42:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4386/10070 [2:05:02<2:42:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4387/10070 [2:05:03<2:41:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4387/10070 [2:05:03<2:41:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4388/10070 [2:05:04<2:41:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4388/10070 [2:05:04<2:41:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4389/10070 [2:05:05<2:41:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4389/10070 [2:05:05<2:41:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4390/10070 [2:05:07<2:41:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4390/10070 [2:05:07<2:41:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4391/10070 [2:05:07<2:41:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4391/10070 [2:05:07<2:41:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4392/10070 [2:05:09<2:41:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4392/10070 [2:05:09<2:41:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4393/10070 [2:05:10<2:41:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4393/10070 [2:05:10<2:41:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4394/10070 [2:05:13<2:41:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4394/10070 [2:05:13<2:41:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4395/10070 [2:05:15<2:41:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4395/10070 [2:05:15<2:41:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4396/10070 [2:05:16<2:41:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4396/10070 [2:05:16<2:41:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4397/10070 [2:05:18<2:41:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4397/10070 [2:05:18<2:41:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4398/10070 [2:05:19<2:41:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4398/10070 [2:05:19<2:41:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4399/10070 [2:05:21<2:41:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4399/10070 [2:05:21<2:41:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4400/10070 [2:05:21<2:41:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4400/10070 [2:05:21<2:41:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4401/10070 [2:05:23<2:41:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4401/10070 [2:05:23<2:41:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4402/10070 [2:05:25<2:41:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4402/10070 [2:05:25<2:41:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4403/10070 [2:05:27<2:41:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4403/10070 [2:05:27<2:41:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4404/10070 [2:05:29<2:41:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4404/10070 [2:05:29<2:41:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4405/10070 [2:05:30<2:41:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4405/10070 [2:05:30<2:41:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4406/10070 [2:05:31<2:41:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4406/10070 [2:05:31<2:41:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4407/10070 [2:05:32<2:41:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4407/10070 [2:05:32<2:41:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4408/10070 [2:05:34<2:41:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4408/10070 [2:05:34<2:41:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4409/10070 [2:05:34<2:41:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4409/10070 [2:05:34<2:41:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4410/10070 [2:05:36<2:41:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4410/10070 [2:05:36<2:41:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4411/10070 [2:05:38<2:41:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4411/10070 [2:05:38<2:41:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4412/10070 [2:05:39<2:41:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4412/10070 [2:05:39<2:41:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4413/10070 [2:05:41<2:41:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4413/10070 [2:05:41<2:41:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4414/10070 [2:05:44<2:41:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4414/10070 [2:05:44<2:41:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4415/10070 [2:05:44<2:41:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4415/10070 [2:05:44<2:41:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4416/10070 [2:05:53<2:41:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4416/10070 [2:05:53<2:41:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4417/10070 [2:05:55<2:41:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4417/10070 [2:05:55<2:41:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4418/10070 [2:05:56<2:41:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4418/10070 [2:05:56<2:41:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4419/10070 [2:05:58<2:41:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4419/10070 [2:05:58<2:41:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4420/10070 [2:05:59<2:41:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4420/10070 [2:05:59<2:41:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4421/10070 [2:06:01<2:41:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4421/10070 [2:06:01<2:41:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4422/10070 [2:06:02<2:40:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4422/10070 [2:06:02<2:40:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4423/10070 [2:06:03<2:40:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4423/10070 [2:06:03<2:40:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4424/10070 [2:06:04<2:40:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4424/10070 [2:06:04<2:40:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4425/10070 [2:06:06<2:40:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4425/10070 [2:06:06<2:40:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4426/10070 [2:06:07<2:40:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4426/10070 [2:06:07<2:40:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4427/10070 [2:06:09<2:40:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4427/10070 [2:06:09<2:40:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4428/10070 [2:06:11<2:40:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4428/10070 [2:06:11<2:40:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4429/10070 [2:06:12<2:40:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4429/10070 [2:06:12<2:40:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4430/10070 [2:06:13<2:40:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4430/10070 [2:06:13<2:40:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4431/10070 [2:06:14<2:40:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4431/10070 [2:06:14<2:40:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4432/10070 [2:06:14<2:40:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4432/10070 [2:06:14<2:40:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4433/10070 [2:06:16<2:40:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4433/10070 [2:06:16<2:40:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4434/10070 [2:06:17<2:40:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4434/10070 [2:06:17<2:40:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4435/10070 [2:06:18<2:40:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4435/10070 [2:06:18<2:40:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4436/10070 [2:06:20<2:40:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4436/10070 [2:06:20<2:40:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4437/10070 [2:06:22<2:40:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4437/10070 [2:06:22<2:40:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4438/10070 [2:06:23<2:40:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4438/10070 [2:06:23<2:40:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4439/10070 [2:06:25<2:40:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4439/10070 [2:06:25<2:40:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4440/10070 [2:06:26<2:40:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4440/10070 [2:06:26<2:40:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4441/10070 [2:06:29<2:40:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4441/10070 [2:06:29<2:40:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4442/10070 [2:06:31<2:40:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4442/10070 [2:06:31<2:40:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4443/10070 [2:06:32<2:40:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4443/10070 [2:06:32<2:40:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4444/10070 [2:06:34<2:40:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4444/10070 [2:06:34<2:40:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4445/10070 [2:06:35<2:40:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4445/10070 [2:06:35<2:40:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4446/10070 [2:06:36<2:40:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4446/10070 [2:06:36<2:40:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4447/10070 [2:06:37<2:40:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4447/10070 [2:06:37<2:40:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4448/10070 [2:06:46<2:40:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4448/10070 [2:06:46<2:40:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4449/10070 [2:06:47<2:40:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4449/10070 [2:06:47<2:40:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4450/10070 [2:06:48<2:40:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4450/10070 [2:06:48<2:40:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4451/10070 [2:06:49<2:40:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4451/10070 [2:06:49<2:40:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4452/10070 [2:06:50<2:40:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4452/10070 [2:06:50<2:40:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4453/10070 [2:06:52<2:40:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4453/10070 [2:06:52<2:40:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4454/10070 [2:06:53<2:39:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4454/10070 [2:06:53<2:39:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4455/10070 [2:06:54<2:39:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4455/10070 [2:06:54<2:39:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4456/10070 [2:06:55<2:39:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4456/10070 [2:06:55<2:39:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4457/10070 [2:06:57<2:39:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4457/10070 [2:06:57<2:39:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4458/10070 [2:06:58<2:39:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4458/10070 [2:06:58<2:39:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4459/10070 [2:06:59<2:39:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4459/10070 [2:06:59<2:39:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4460/10070 [2:07:00<2:39:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4460/10070 [2:07:00<2:39:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4461/10070 [2:07:01<2:39:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4461/10070 [2:07:01<2:39:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4462/10070 [2:07:03<2:39:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4462/10070 [2:07:03<2:39:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4463/10070 [2:07:03<2:39:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4463/10070 [2:07:03<2:39:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4464/10070 [2:07:05<2:39:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4464/10070 [2:07:05<2:39:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4465/10070 [2:07:06<2:39:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4465/10070 [2:07:06<2:39:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4466/10070 [2:07:08<2:39:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4466/10070 [2:07:08<2:39:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4467/10070 [2:07:09<2:39:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4467/10070 [2:07:09<2:39:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4468/10070 [2:07:11<2:39:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4468/10070 [2:07:11<2:39:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4469/10070 [2:07:13<2:39:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4469/10070 [2:07:13<2:39:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4470/10070 [2:07:15<2:39:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4470/10070 [2:07:15<2:39:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4471/10070 [2:07:17<2:39:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4471/10070 [2:07:17<2:39:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4472/10070 [2:07:19<2:39:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4472/10070 [2:07:19<2:39:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4473/10070 [2:07:20<2:39:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4473/10070 [2:07:20<2:39:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4474/10070 [2:07:21<2:39:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4474/10070 [2:07:21<2:39:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4475/10070 [2:07:22<2:39:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4475/10070 [2:07:22<2:39:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4476/10070 [2:07:23<2:39:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4476/10070 [2:07:23<2:39:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4477/10070 [2:07:25<2:39:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4477/10070 [2:07:25<2:39:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4478/10070 [2:07:26<2:39:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4478/10070 [2:07:26<2:39:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4479/10070 [2:07:28<2:39:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4479/10070 [2:07:28<2:39:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4480/10070 [2:07:44<2:39:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4480/10070 [2:07:44<2:39:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  44%|▍| 4481/10070 [2:07:46<2:39:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  44%|▍| 4481/10070 [2:07:46<2:39:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4482/10070 [2:07:48<2:39:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4482/10070 [2:07:48<2:39:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4483/10070 [2:07:50<2:39:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4483/10070 [2:07:50<2:39:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4484/10070 [2:07:51<2:39:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4484/10070 [2:07:51<2:39:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4485/10070 [2:07:52<2:39:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4485/10070 [2:07:52<2:39:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4486/10070 [2:07:55<2:39:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4486/10070 [2:07:55<2:39:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4487/10070 [2:07:57<2:39:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4487/10070 [2:07:57<2:39:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4488/10070 [2:07:59<2:39:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4488/10070 [2:07:59<2:39:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4489/10070 [2:07:59<2:39:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4489/10070 [2:07:59<2:39:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4490/10070 [2:08:00<2:39:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4490/10070 [2:08:00<2:39:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4491/10070 [2:08:01<2:39:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4491/10070 [2:08:01<2:39:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4492/10070 [2:08:02<2:38:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4492/10070 [2:08:02<2:38:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4493/10070 [2:08:04<2:38:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4493/10070 [2:08:04<2:38:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4494/10070 [2:08:06<2:38:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4494/10070 [2:08:06<2:38:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4495/10070 [2:08:08<2:38:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4495/10070 [2:08:08<2:38:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4496/10070 [2:08:09<2:38:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4496/10070 [2:08:09<2:38:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4497/10070 [2:08:12<2:38:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4497/10070 [2:08:12<2:38:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4498/10070 [2:08:13<2:38:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4498/10070 [2:08:13<2:38:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4499/10070 [2:08:13<2:38:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4499/10070 [2:08:13<2:38:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4500/10070 [2:08:15<2:38:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4500/10070 [2:08:15<2:38:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4501/10070 [2:08:15<2:38:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4501/10070 [2:08:15<2:38:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4502/10070 [2:08:17<2:38:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4502/10070 [2:08:17<2:38:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4503/10070 [2:08:17<2:38:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4503/10070 [2:08:17<2:38:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4504/10070 [2:08:18<2:38:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4504/10070 [2:08:18<2:38:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4505/10070 [2:08:20<2:38:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4505/10070 [2:08:20<2:38:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4506/10070 [2:08:21<2:38:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4506/10070 [2:08:21<2:38:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4507/10070 [2:08:23<2:38:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4507/10070 [2:08:23<2:38:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4508/10070 [2:08:24<2:38:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4508/10070 [2:08:24<2:38:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4509/10070 [2:08:25<2:38:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4509/10070 [2:08:25<2:38:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4510/10070 [2:08:27<2:38:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4510/10070 [2:08:27<2:38:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4511/10070 [2:08:27<2:38:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4511/10070 [2:08:27<2:38:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4512/10070 [2:08:36<2:38:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4512/10070 [2:08:36<2:38:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4513/10070 [2:08:38<2:38:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4513/10070 [2:08:38<2:38:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4514/10070 [2:08:39<2:38:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4514/10070 [2:08:39<2:38:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4515/10070 [2:08:40<2:38:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4515/10070 [2:08:40<2:38:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4516/10070 [2:08:42<2:38:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4516/10070 [2:08:42<2:38:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4517/10070 [2:08:43<2:38:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4517/10070 [2:08:43<2:38:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4518/10070 [2:08:44<2:38:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4518/10070 [2:08:44<2:38:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4519/10070 [2:08:46<2:38:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4519/10070 [2:08:46<2:38:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4520/10070 [2:08:48<2:38:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4520/10070 [2:08:48<2:38:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4521/10070 [2:08:50<2:38:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4521/10070 [2:08:50<2:38:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4522/10070 [2:08:50<2:38:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4522/10070 [2:08:50<2:38:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4523/10070 [2:08:51<2:38:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4523/10070 [2:08:51<2:38:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4524/10070 [2:08:53<2:38:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4524/10070 [2:08:53<2:38:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4525/10070 [2:08:54<2:37:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4525/10070 [2:08:54<2:37:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4526/10070 [2:08:56<2:37:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4526/10070 [2:08:56<2:37:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4527/10070 [2:08:59<2:37:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4527/10070 [2:08:59<2:37:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4528/10070 [2:08:59<2:37:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4528/10070 [2:08:59<2:37:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4529/10070 [2:09:00<2:37:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4529/10070 [2:09:00<2:37:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4530/10070 [2:09:01<2:37:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4530/10070 [2:09:01<2:37:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4531/10070 [2:09:03<2:37:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4531/10070 [2:09:03<2:37:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4532/10070 [2:09:04<2:37:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4532/10070 [2:09:04<2:37:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4533/10070 [2:09:05<2:37:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4533/10070 [2:09:05<2:37:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4534/10070 [2:09:05<2:37:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4534/10070 [2:09:05<2:37:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4535/10070 [2:09:07<2:37:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4535/10070 [2:09:07<2:37:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4536/10070 [2:09:08<2:37:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4536/10070 [2:09:08<2:37:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4537/10070 [2:09:10<2:37:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4537/10070 [2:09:10<2:37:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4538/10070 [2:09:11<2:37:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4538/10070 [2:09:11<2:37:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4539/10070 [2:09:13<2:37:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4539/10070 [2:09:13<2:37:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4540/10070 [2:09:15<2:37:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4540/10070 [2:09:15<2:37:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4541/10070 [2:09:17<2:37:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4541/10070 [2:09:17<2:37:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4542/10070 [2:09:19<2:37:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4542/10070 [2:09:19<2:37:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4543/10070 [2:09:19<2:37:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4543/10070 [2:09:19<2:37:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4544/10070 [2:09:33<2:37:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4544/10070 [2:09:33<2:37:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4545/10070 [2:09:34<2:37:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4545/10070 [2:09:34<2:37:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4546/10070 [2:09:35<2:37:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4546/10070 [2:09:35<2:37:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4547/10070 [2:09:37<2:37:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4547/10070 [2:09:37<2:37:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4548/10070 [2:09:38<2:37:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4548/10070 [2:09:38<2:37:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4549/10070 [2:09:39<2:37:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4549/10070 [2:09:39<2:37:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4550/10070 [2:09:41<2:37:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4550/10070 [2:09:41<2:37:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4551/10070 [2:09:42<2:37:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4551/10070 [2:09:42<2:37:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4552/10070 [2:09:44<2:37:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4552/10070 [2:09:44<2:37:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4553/10070 [2:09:45<2:37:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4553/10070 [2:09:45<2:37:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4554/10070 [2:09:46<2:37:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4554/10070 [2:09:46<2:37:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4555/10070 [2:09:47<2:37:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4555/10070 [2:09:47<2:37:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4556/10070 [2:09:48<2:37:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4556/10070 [2:09:48<2:37:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4557/10070 [2:09:50<2:37:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4557/10070 [2:09:50<2:37:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4558/10070 [2:09:51<2:37:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4558/10070 [2:09:51<2:37:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4559/10070 [2:09:52<2:36:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4559/10070 [2:09:52<2:36:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4560/10070 [2:09:54<2:36:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4560/10070 [2:09:54<2:36:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4561/10070 [2:09:56<2:36:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4561/10070 [2:09:56<2:36:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4562/10070 [2:09:57<2:36:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4562/10070 [2:09:57<2:36:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4563/10070 [2:09:58<2:36:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4563/10070 [2:09:58<2:36:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4564/10070 [2:10:00<2:36:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4564/10070 [2:10:00<2:36:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4565/10070 [2:10:01<2:36:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4565/10070 [2:10:01<2:36:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4566/10070 [2:10:04<2:36:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4566/10070 [2:10:04<2:36:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4567/10070 [2:10:04<2:36:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4567/10070 [2:10:04<2:36:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4568/10070 [2:10:06<2:36:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4568/10070 [2:10:06<2:36:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4569/10070 [2:10:07<2:36:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4569/10070 [2:10:07<2:36:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4570/10070 [2:10:08<2:36:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4570/10070 [2:10:08<2:36:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4571/10070 [2:10:09<2:36:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4571/10070 [2:10:09<2:36:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4572/10070 [2:10:11<2:36:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4572/10070 [2:10:11<2:36:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4573/10070 [2:10:11<2:36:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4573/10070 [2:10:11<2:36:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4574/10070 [2:10:13<2:36:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4574/10070 [2:10:13<2:36:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4575/10070 [2:10:15<2:36:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4575/10070 [2:10:15<2:36:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4576/10070 [2:10:31<2:36:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4576/10070 [2:10:31<2:36:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4577/10070 [2:10:33<2:36:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4577/10070 [2:10:33<2:36:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4578/10070 [2:10:35<2:36:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4578/10070 [2:10:35<2:36:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4579/10070 [2:10:36<2:36:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4579/10070 [2:10:36<2:36:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4580/10070 [2:10:37<2:36:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4580/10070 [2:10:37<2:36:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  45%|▍| 4581/10070 [2:10:39<2:36:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  45%|▍| 4581/10070 [2:10:39<2:36:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4582/10070 [2:10:40<2:36:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4582/10070 [2:10:40<2:36:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4583/10070 [2:10:42<2:36:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4583/10070 [2:10:42<2:36:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4584/10070 [2:10:44<2:36:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4584/10070 [2:10:44<2:36:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4585/10070 [2:10:45<2:36:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4585/10070 [2:10:45<2:36:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4586/10070 [2:10:48<2:36:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4586/10070 [2:10:48<2:36:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4587/10070 [2:10:50<2:36:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4587/10070 [2:10:50<2:36:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4588/10070 [2:10:52<2:36:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4588/10070 [2:10:52<2:36:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4589/10070 [2:10:54<2:36:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4589/10070 [2:10:54<2:36:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4590/10070 [2:10:56<2:36:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4590/10070 [2:10:56<2:36:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4591/10070 [2:10:57<2:36:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4591/10070 [2:10:57<2:36:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4592/10070 [2:10:58<2:36:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4592/10070 [2:10:58<2:36:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4593/10070 [2:11:00<2:36:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4593/10070 [2:11:00<2:36:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4594/10070 [2:11:00<2:36:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4594/10070 [2:11:00<2:36:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4595/10070 [2:11:01<2:36:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4595/10070 [2:11:02<2:36:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4596/10070 [2:11:03<2:36:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4596/10070 [2:11:03<2:36:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4597/10070 [2:11:05<2:36:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4597/10070 [2:11:05<2:36:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4598/10070 [2:11:07<2:36:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4598/10070 [2:11:07<2:36:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4599/10070 [2:11:08<2:36:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4599/10070 [2:11:08<2:36:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4600/10070 [2:11:10<2:35:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4600/10070 [2:11:10<2:35:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4601/10070 [2:11:12<2:35:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4601/10070 [2:11:12<2:35:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4602/10070 [2:11:15<2:35:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4602/10070 [2:11:15<2:35:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4603/10070 [2:11:16<2:35:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4603/10070 [2:11:16<2:35:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4604/10070 [2:11:17<2:35:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4604/10070 [2:11:17<2:35:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4605/10070 [2:11:18<2:35:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4605/10070 [2:11:18<2:35:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4606/10070 [2:11:20<2:35:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4606/10070 [2:11:20<2:35:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4607/10070 [2:11:21<2:35:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4607/10070 [2:11:21<2:35:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4608/10070 [2:11:27<2:35:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4608/10070 [2:11:27<2:35:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4609/10070 [2:11:28<2:35:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4609/10070 [2:11:28<2:35:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4610/10070 [2:11:29<2:35:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4610/10070 [2:11:29<2:35:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4611/10070 [2:11:31<2:35:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4611/10070 [2:11:31<2:35:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4612/10070 [2:11:32<2:35:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4612/10070 [2:11:32<2:35:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4613/10070 [2:11:33<2:35:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4613/10070 [2:11:33<2:35:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4614/10070 [2:11:34<2:35:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4614/10070 [2:11:34<2:35:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4615/10070 [2:11:35<2:35:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4615/10070 [2:11:35<2:35:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4616/10070 [2:11:36<2:35:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4616/10070 [2:11:36<2:35:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4617/10070 [2:11:37<2:35:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4617/10070 [2:11:37<2:35:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4618/10070 [2:11:39<2:35:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4618/10070 [2:11:39<2:35:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4619/10070 [2:11:41<2:35:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4619/10070 [2:11:41<2:35:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4620/10070 [2:11:42<2:35:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4620/10070 [2:11:42<2:35:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4621/10070 [2:11:43<2:35:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4621/10070 [2:11:43<2:35:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4622/10070 [2:11:45<2:35:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4622/10070 [2:11:45<2:35:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4623/10070 [2:11:47<2:35:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4623/10070 [2:11:47<2:35:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4624/10070 [2:11:50<2:35:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4624/10070 [2:11:50<2:35:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4625/10070 [2:11:50<2:35:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4625/10070 [2:11:50<2:35:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4626/10070 [2:11:51<2:35:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4626/10070 [2:11:51<2:35:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4627/10070 [2:11:52<2:35:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4627/10070 [2:11:52<2:35:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4628/10070 [2:11:54<2:35:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4628/10070 [2:11:54<2:35:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4629/10070 [2:11:57<2:35:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4629/10070 [2:11:57<2:35:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4630/10070 [2:11:58<2:35:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4630/10070 [2:11:58<2:35:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4631/10070 [2:12:01<2:35:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4631/10070 [2:12:01<2:35:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4632/10070 [2:12:01<2:35:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4632/10070 [2:12:01<2:35:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4633/10070 [2:12:02<2:34:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4633/10070 [2:12:02<2:34:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4634/10070 [2:12:03<2:34:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4634/10070 [2:12:03<2:34:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4635/10070 [2:12:05<2:34:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4635/10070 [2:12:05<2:34:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4636/10070 [2:12:08<2:34:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4636/10070 [2:12:08<2:34:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4637/10070 [2:12:09<2:34:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4637/10070 [2:12:09<2:34:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4638/10070 [2:12:09<2:34:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4638/10070 [2:12:09<2:34:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4639/10070 [2:12:11<2:34:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4639/10070 [2:12:11<2:34:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4640/10070 [2:12:22<2:34:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4640/10070 [2:12:22<2:34:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4641/10070 [2:12:23<2:34:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4641/10070 [2:12:23<2:34:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4642/10070 [2:12:24<2:34:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4642/10070 [2:12:24<2:34:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4643/10070 [2:12:24<2:34:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4643/10070 [2:12:24<2:34:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4644/10070 [2:12:25<2:34:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4644/10070 [2:12:25<2:34:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4645/10070 [2:12:27<2:34:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4645/10070 [2:12:27<2:34:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4646/10070 [2:12:29<2:34:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4646/10070 [2:12:29<2:34:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4647/10070 [2:12:30<2:34:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4647/10070 [2:12:30<2:34:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4648/10070 [2:12:31<2:34:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4648/10070 [2:12:31<2:34:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4649/10070 [2:12:32<2:34:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4649/10070 [2:12:32<2:34:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4650/10070 [2:12:33<2:34:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4650/10070 [2:12:33<2:34:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4651/10070 [2:12:34<2:34:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4651/10070 [2:12:34<2:34:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4652/10070 [2:12:35<2:34:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4652/10070 [2:12:35<2:34:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4653/10070 [2:12:37<2:34:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4653/10070 [2:12:37<2:34:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4654/10070 [2:12:38<2:34:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4654/10070 [2:12:38<2:34:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4655/10070 [2:12:39<2:34:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4655/10070 [2:12:39<2:34:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4656/10070 [2:12:40<2:34:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4656/10070 [2:12:40<2:34:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4657/10070 [2:12:43<2:34:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4657/10070 [2:12:43<2:34:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4658/10070 [2:12:44<2:34:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4658/10070 [2:12:44<2:34:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4659/10070 [2:12:46<2:34:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4659/10070 [2:12:46<2:34:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4660/10070 [2:12:48<2:34:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4660/10070 [2:12:48<2:34:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4661/10070 [2:12:49<2:34:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4661/10070 [2:12:49<2:34:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4662/10070 [2:12:50<2:34:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4662/10070 [2:12:50<2:34:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4663/10070 [2:12:51<2:34:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4663/10070 [2:12:51<2:34:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4664/10070 [2:12:52<2:34:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4664/10070 [2:12:52<2:34:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4665/10070 [2:12:54<2:33:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4665/10070 [2:12:54<2:33:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4666/10070 [2:12:56<2:33:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4666/10070 [2:12:56<2:33:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4667/10070 [2:12:59<2:33:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4667/10070 [2:12:59<2:33:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4668/10070 [2:13:00<2:33:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4668/10070 [2:13:00<2:33:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4669/10070 [2:13:01<2:33:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4669/10070 [2:13:01<2:33:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4670/10070 [2:13:02<2:33:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4670/10070 [2:13:02<2:33:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4671/10070 [2:13:03<2:33:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4671/10070 [2:13:03<2:33:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4672/10070 [2:13:14<2:33:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4672/10070 [2:13:14<2:33:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4673/10070 [2:13:16<2:33:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4673/10070 [2:13:16<2:33:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4674/10070 [2:13:18<2:33:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4674/10070 [2:13:18<2:33:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4675/10070 [2:13:18<2:33:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4675/10070 [2:13:18<2:33:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4676/10070 [2:13:20<2:33:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4676/10070 [2:13:20<2:33:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4677/10070 [2:13:22<2:33:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4677/10070 [2:13:22<2:33:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4678/10070 [2:13:24<2:33:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4678/10070 [2:13:24<2:33:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4679/10070 [2:13:25<2:33:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4679/10070 [2:13:25<2:33:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4680/10070 [2:13:26<2:33:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4680/10070 [2:13:26<2:33:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4681/10070 [2:13:27<2:33:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4681/10070 [2:13:27<2:33:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  46%|▍| 4682/10070 [2:13:30<2:33:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  46%|▍| 4682/10070 [2:13:30<2:33:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4683/10070 [2:13:31<2:33:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4683/10070 [2:13:31<2:33:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4684/10070 [2:13:32<2:33:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4684/10070 [2:13:32<2:33:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4685/10070 [2:13:33<2:33:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4685/10070 [2:13:33<2:33:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4686/10070 [2:13:34<2:33:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4686/10070 [2:13:34<2:33:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4687/10070 [2:13:35<2:33:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4687/10070 [2:13:35<2:33:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4688/10070 [2:13:36<2:33:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4688/10070 [2:13:36<2:33:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4689/10070 [2:13:38<2:33:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4689/10070 [2:13:38<2:33:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4690/10070 [2:13:39<2:33:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4690/10070 [2:13:39<2:33:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4691/10070 [2:13:39<2:33:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4691/10070 [2:13:39<2:33:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4692/10070 [2:13:40<2:33:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4692/10070 [2:13:40<2:33:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4693/10070 [2:13:42<2:33:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4693/10070 [2:13:42<2:33:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4694/10070 [2:13:43<2:33:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4694/10070 [2:13:43<2:33:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4695/10070 [2:13:44<2:33:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4695/10070 [2:13:44<2:33:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4696/10070 [2:13:46<2:33:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4696/10070 [2:13:46<2:33:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4697/10070 [2:13:46<2:33:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4697/10070 [2:13:46<2:33:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4698/10070 [2:13:49<2:33:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4698/10070 [2:13:49<2:33:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4699/10070 [2:13:50<2:32:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4699/10070 [2:13:50<2:32:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4700/10070 [2:13:52<2:32:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4700/10070 [2:13:52<2:32:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4701/10070 [2:13:53<2:32:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4701/10070 [2:13:53<2:32:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4702/10070 [2:13:54<2:32:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4702/10070 [2:13:54<2:32:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4703/10070 [2:13:55<2:32:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4703/10070 [2:13:55<2:32:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4704/10070 [2:14:08<2:33:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4704/10070 [2:14:08<2:33:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4705/10070 [2:14:10<2:32:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4705/10070 [2:14:10<2:32:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4706/10070 [2:14:10<2:32:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4706/10070 [2:14:10<2:32:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4707/10070 [2:14:12<2:32:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4707/10070 [2:14:12<2:32:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4708/10070 [2:14:14<2:32:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4708/10070 [2:14:14<2:32:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4709/10070 [2:14:14<2:32:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4709/10070 [2:14:14<2:32:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4710/10070 [2:14:16<2:32:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4710/10070 [2:14:16<2:32:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4711/10070 [2:14:17<2:32:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4711/10070 [2:14:17<2:32:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4712/10070 [2:14:19<2:32:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4712/10070 [2:14:19<2:32:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4713/10070 [2:14:20<2:32:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4713/10070 [2:14:20<2:32:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4714/10070 [2:14:21<2:32:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4714/10070 [2:14:21<2:32:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4715/10070 [2:14:24<2:32:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4715/10070 [2:14:24<2:32:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4716/10070 [2:14:25<2:32:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4716/10070 [2:14:25<2:32:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4717/10070 [2:14:27<2:32:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4717/10070 [2:14:27<2:32:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4718/10070 [2:14:29<2:32:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4718/10070 [2:14:29<2:32:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4719/10070 [2:14:30<2:32:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4719/10070 [2:14:30<2:32:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4720/10070 [2:14:32<2:32:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4720/10070 [2:14:32<2:32:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4721/10070 [2:14:33<2:32:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4721/10070 [2:14:33<2:32:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4722/10070 [2:14:34<2:32:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4722/10070 [2:14:34<2:32:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4723/10070 [2:14:36<2:32:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4723/10070 [2:14:36<2:32:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4724/10070 [2:14:37<2:32:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4724/10070 [2:14:37<2:32:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4725/10070 [2:14:39<2:32:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4725/10070 [2:14:39<2:32:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4726/10070 [2:14:40<2:32:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4726/10070 [2:14:40<2:32:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4727/10070 [2:14:41<2:32:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4727/10070 [2:14:41<2:32:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4728/10070 [2:14:42<2:32:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4728/10070 [2:14:42<2:32:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4729/10070 [2:14:43<2:32:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4729/10070 [2:14:43<2:32:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4730/10070 [2:14:45<2:32:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4730/10070 [2:14:45<2:32:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4731/10070 [2:14:47<2:32:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4731/10070 [2:14:47<2:32:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4732/10070 [2:14:48<2:32:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4732/10070 [2:14:48<2:32:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4733/10070 [2:14:49<2:32:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4733/10070 [2:14:49<2:32:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4734/10070 [2:14:51<2:31:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4734/10070 [2:14:51<2:31:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4735/10070 [2:14:52<2:31:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4735/10070 [2:14:52<2:31:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4736/10070 [2:15:01<2:32:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4736/10070 [2:15:01<2:32:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4737/10070 [2:15:04<2:32:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4737/10070 [2:15:04<2:32:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4738/10070 [2:15:04<2:32:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4738/10070 [2:15:04<2:32:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4739/10070 [2:15:06<2:31:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4739/10070 [2:15:06<2:31:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4740/10070 [2:15:07<2:31:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4740/10070 [2:15:07<2:31:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4741/10070 [2:15:08<2:31:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4741/10070 [2:15:08<2:31:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4742/10070 [2:15:09<2:31:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4742/10070 [2:15:09<2:31:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4743/10070 [2:15:11<2:31:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4743/10070 [2:15:11<2:31:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4744/10070 [2:15:12<2:31:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4744/10070 [2:15:12<2:31:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4745/10070 [2:15:14<2:31:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4745/10070 [2:15:14<2:31:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4746/10070 [2:15:16<2:31:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4746/10070 [2:15:16<2:31:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4747/10070 [2:15:17<2:31:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4747/10070 [2:15:17<2:31:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4748/10070 [2:15:19<2:31:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4748/10070 [2:15:19<2:31:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4749/10070 [2:15:20<2:31:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4749/10070 [2:15:20<2:31:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4750/10070 [2:15:21<2:31:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4750/10070 [2:15:21<2:31:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4751/10070 [2:15:21<2:31:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4751/10070 [2:15:21<2:31:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4752/10070 [2:15:23<2:31:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4752/10070 [2:15:23<2:31:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4753/10070 [2:15:25<2:31:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4753/10070 [2:15:25<2:31:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4754/10070 [2:15:26<2:31:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4754/10070 [2:15:26<2:31:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4755/10070 [2:15:28<2:31:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4755/10070 [2:15:28<2:31:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4756/10070 [2:15:29<2:31:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4756/10070 [2:15:29<2:31:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4757/10070 [2:15:29<2:31:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4757/10070 [2:15:29<2:31:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4758/10070 [2:15:30<2:31:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4758/10070 [2:15:30<2:31:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4759/10070 [2:15:31<2:31:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4759/10070 [2:15:31<2:31:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4760/10070 [2:15:33<2:31:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4760/10070 [2:15:33<2:31:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4761/10070 [2:15:33<2:31:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4761/10070 [2:15:33<2:31:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4762/10070 [2:15:35<2:31:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4762/10070 [2:15:35<2:31:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4763/10070 [2:15:35<2:31:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4763/10070 [2:15:35<2:31:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4764/10070 [2:15:36<2:31:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4764/10070 [2:15:36<2:31:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4765/10070 [2:15:38<2:31:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4765/10070 [2:15:38<2:31:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4766/10070 [2:15:39<2:30:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4766/10070 [2:15:39<2:30:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4767/10070 [2:15:41<2:30:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4767/10070 [2:15:41<2:30:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4768/10070 [2:15:55<2:31:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4768/10070 [2:15:55<2:31:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4769/10070 [2:15:57<2:31:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4769/10070 [2:15:57<2:31:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4770/10070 [2:15:58<2:31:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4770/10070 [2:15:58<2:31:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4771/10070 [2:16:00<2:31:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4771/10070 [2:16:00<2:31:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4772/10070 [2:16:01<2:31:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4772/10070 [2:16:01<2:31:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4773/10070 [2:16:03<2:30:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4773/10070 [2:16:03<2:30:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4774/10070 [2:16:04<2:30:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4774/10070 [2:16:04<2:30:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4775/10070 [2:16:05<2:30:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4775/10070 [2:16:05<2:30:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4776/10070 [2:16:07<2:30:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4776/10070 [2:16:07<2:30:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4777/10070 [2:16:09<2:30:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4777/10070 [2:16:09<2:30:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4778/10070 [2:16:11<2:30:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4778/10070 [2:16:11<2:30:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4779/10070 [2:16:13<2:30:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4779/10070 [2:16:13<2:30:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4780/10070 [2:16:15<2:30:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4780/10070 [2:16:15<2:30:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4781/10070 [2:16:16<2:30:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4781/10070 [2:16:16<2:30:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4782/10070 [2:16:18<2:30:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4782/10070 [2:16:18<2:30:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  47%|▍| 4783/10070 [2:16:19<2:30:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  47%|▍| 4783/10070 [2:16:19<2:30:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4784/10070 [2:16:20<2:30:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4784/10070 [2:16:20<2:30:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4785/10070 [2:16:20<2:30:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4785/10070 [2:16:20<2:30:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4786/10070 [2:16:21<2:30:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4786/10070 [2:16:21<2:30:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4787/10070 [2:16:22<2:30:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4787/10070 [2:16:22<2:30:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4788/10070 [2:16:23<2:30:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4788/10070 [2:16:23<2:30:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4789/10070 [2:16:25<2:30:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4789/10070 [2:16:25<2:30:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4790/10070 [2:16:27<2:30:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4790/10070 [2:16:27<2:30:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4791/10070 [2:16:28<2:30:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4791/10070 [2:16:28<2:30:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4792/10070 [2:16:30<2:30:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4792/10070 [2:16:30<2:30:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4793/10070 [2:16:31<2:30:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4793/10070 [2:16:31<2:30:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4794/10070 [2:16:33<2:30:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4794/10070 [2:16:33<2:30:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4795/10070 [2:16:34<2:30:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4795/10070 [2:16:34<2:30:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4796/10070 [2:16:35<2:30:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4796/10070 [2:16:35<2:30:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4797/10070 [2:16:36<2:30:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4797/10070 [2:16:36<2:30:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4798/10070 [2:16:37<2:30:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4798/10070 [2:16:37<2:30:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4799/10070 [2:16:39<2:30:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4799/10070 [2:16:39<2:30:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4800/10070 [2:16:47<2:30:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4800/10070 [2:16:47<2:30:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4801/10070 [2:17:11<2:30:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4801/10070 [2:17:11<2:30:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4802/10070 [2:17:12<2:30:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4802/10070 [2:17:12<2:30:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4803/10070 [2:17:14<2:30:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4803/10070 [2:17:14<2:30:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4804/10070 [2:17:15<2:30:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4804/10070 [2:17:15<2:30:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4805/10070 [2:17:16<2:30:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4805/10070 [2:17:16<2:30:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4806/10070 [2:17:17<2:30:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4806/10070 [2:17:17<2:30:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4807/10070 [2:17:19<2:30:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4807/10070 [2:17:19<2:30:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4808/10070 [2:17:20<2:30:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4808/10070 [2:17:20<2:30:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4809/10070 [2:17:22<2:30:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4809/10070 [2:17:22<2:30:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4810/10070 [2:17:23<2:30:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4810/10070 [2:17:23<2:30:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4811/10070 [2:17:24<2:30:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4811/10070 [2:17:24<2:30:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4812/10070 [2:17:24<2:30:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4812/10070 [2:17:24<2:30:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4813/10070 [2:17:25<2:30:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4813/10070 [2:17:25<2:30:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4814/10070 [2:17:26<2:30:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4814/10070 [2:17:26<2:30:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4815/10070 [2:17:26<2:30:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4815/10070 [2:17:26<2:30:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4816/10070 [2:17:27<2:29:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4816/10070 [2:17:27<2:29:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4817/10070 [2:17:29<2:29:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4817/10070 [2:17:29<2:29:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4818/10070 [2:17:30<2:29:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4818/10070 [2:17:30<2:29:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4819/10070 [2:17:31<2:29:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4819/10070 [2:17:31<2:29:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4820/10070 [2:17:32<2:29:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4820/10070 [2:17:32<2:29:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4821/10070 [2:17:33<2:29:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4821/10070 [2:17:33<2:29:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4822/10070 [2:17:35<2:29:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4822/10070 [2:17:35<2:29:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4823/10070 [2:17:37<2:29:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4823/10070 [2:17:37<2:29:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4824/10070 [2:17:38<2:29:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4824/10070 [2:17:38<2:29:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4825/10070 [2:17:39<2:29:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4825/10070 [2:17:39<2:29:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4826/10070 [2:17:42<2:29:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4826/10070 [2:17:42<2:29:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4827/10070 [2:17:43<2:29:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4827/10070 [2:17:43<2:29:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4828/10070 [2:17:45<2:29:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4828/10070 [2:17:45<2:29:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4829/10070 [2:17:47<2:29:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4829/10070 [2:17:47<2:29:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4830/10070 [2:17:48<2:29:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4830/10070 [2:17:48<2:29:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4831/10070 [2:17:48<2:29:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4831/10070 [2:17:48<2:29:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4832/10070 [2:18:01<2:29:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4832/10070 [2:18:01<2:29:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4833/10070 [2:18:02<2:29:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4833/10070 [2:18:02<2:29:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4834/10070 [2:18:04<2:29:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4834/10070 [2:18:04<2:29:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4835/10070 [2:18:06<2:29:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4835/10070 [2:18:06<2:29:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4836/10070 [2:18:07<2:29:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4836/10070 [2:18:07<2:29:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4837/10070 [2:18:09<2:29:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4837/10070 [2:18:09<2:29:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4838/10070 [2:18:10<2:29:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4838/10070 [2:18:10<2:29:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4839/10070 [2:18:11<2:29:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4839/10070 [2:18:11<2:29:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4840/10070 [2:18:12<2:29:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4840/10070 [2:18:12<2:29:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4841/10070 [2:18:14<2:29:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4841/10070 [2:18:14<2:29:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4842/10070 [2:18:17<2:29:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4842/10070 [2:18:17<2:29:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4843/10070 [2:18:17<2:29:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4843/10070 [2:18:17<2:29:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4844/10070 [2:18:18<2:29:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4844/10070 [2:18:18<2:29:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4845/10070 [2:18:20<2:29:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4845/10070 [2:18:20<2:29:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4846/10070 [2:18:21<2:29:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4846/10070 [2:18:21<2:29:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4847/10070 [2:18:21<2:29:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4847/10070 [2:18:21<2:29:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4848/10070 [2:18:23<2:29:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4848/10070 [2:18:23<2:29:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4849/10070 [2:18:25<2:29:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4849/10070 [2:18:25<2:29:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4850/10070 [2:18:26<2:29:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4850/10070 [2:18:26<2:29:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4851/10070 [2:18:28<2:28:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4851/10070 [2:18:28<2:28:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4852/10070 [2:18:28<2:28:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4852/10070 [2:18:28<2:28:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4853/10070 [2:18:31<2:28:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4853/10070 [2:18:31<2:28:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4854/10070 [2:18:33<2:28:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4854/10070 [2:18:33<2:28:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4855/10070 [2:18:35<2:28:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4855/10070 [2:18:35<2:28:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4856/10070 [2:18:36<2:28:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4856/10070 [2:18:36<2:28:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4857/10070 [2:18:37<2:28:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4857/10070 [2:18:37<2:28:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4858/10070 [2:18:39<2:28:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4858/10070 [2:18:39<2:28:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4859/10070 [2:18:40<2:28:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4859/10070 [2:18:40<2:28:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4860/10070 [2:18:40<2:28:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4860/10070 [2:18:40<2:28:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4861/10070 [2:18:41<2:28:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4861/10070 [2:18:41<2:28:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4862/10070 [2:18:43<2:28:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4862/10070 [2:18:43<2:28:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4863/10070 [2:18:44<2:28:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4863/10070 [2:18:44<2:28:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4864/10070 [2:18:54<2:28:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4864/10070 [2:18:54<2:28:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4865/10070 [2:18:55<2:28:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4865/10070 [2:18:55<2:28:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4866/10070 [2:18:56<2:28:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4866/10070 [2:18:56<2:28:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4867/10070 [2:18:57<2:28:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4867/10070 [2:18:57<2:28:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4868/10070 [2:18:58<2:28:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4868/10070 [2:18:58<2:28:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4869/10070 [2:18:59<2:28:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4869/10070 [2:18:59<2:28:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4870/10070 [2:19:01<2:28:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4870/10070 [2:19:01<2:28:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4871/10070 [2:19:03<2:28:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4871/10070 [2:19:03<2:28:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4872/10070 [2:19:04<2:28:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4872/10070 [2:19:04<2:28:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4873/10070 [2:19:06<2:28:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4873/10070 [2:19:06<2:28:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4874/10070 [2:19:07<2:28:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4874/10070 [2:19:07<2:28:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4875/10070 [2:19:08<2:28:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4875/10070 [2:19:08<2:28:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4876/10070 [2:19:08<2:28:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4876/10070 [2:19:08<2:28:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4877/10070 [2:19:10<2:28:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4877/10070 [2:19:10<2:28:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4878/10070 [2:19:11<2:28:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4878/10070 [2:19:11<2:28:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4879/10070 [2:19:12<2:28:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4879/10070 [2:19:12<2:28:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4880/10070 [2:19:14<2:28:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4880/10070 [2:19:14<2:28:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4881/10070 [2:19:15<2:28:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4881/10070 [2:19:15<2:28:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4882/10070 [2:19:17<2:28:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4882/10070 [2:19:17<2:28:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  48%|▍| 4883/10070 [2:19:19<2:28:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  48%|▍| 4883/10070 [2:19:19<2:28:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4884/10070 [2:19:20<2:27:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4884/10070 [2:19:20<2:27:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4885/10070 [2:19:23<2:27:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4885/10070 [2:19:23<2:27:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4886/10070 [2:19:23<2:27:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4886/10070 [2:19:23<2:27:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4887/10070 [2:19:24<2:27:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4887/10070 [2:19:24<2:27:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4888/10070 [2:19:25<2:27:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4888/10070 [2:19:25<2:27:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4889/10070 [2:19:27<2:27:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4889/10070 [2:19:27<2:27:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4890/10070 [2:19:27<2:27:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4890/10070 [2:19:27<2:27:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4891/10070 [2:19:29<2:27:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4891/10070 [2:19:29<2:27:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4892/10070 [2:19:29<2:27:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4892/10070 [2:19:29<2:27:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4893/10070 [2:19:30<2:27:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4893/10070 [2:19:30<2:27:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4894/10070 [2:19:32<2:27:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4894/10070 [2:19:32<2:27:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4895/10070 [2:19:33<2:27:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4895/10070 [2:19:33<2:27:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4896/10070 [2:19:46<2:27:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4896/10070 [2:19:46<2:27:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4897/10070 [2:19:48<2:27:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4897/10070 [2:19:48<2:27:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4898/10070 [2:19:50<2:27:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4898/10070 [2:19:50<2:27:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4899/10070 [2:19:51<2:27:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4899/10070 [2:19:51<2:27:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4900/10070 [2:19:52<2:27:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4900/10070 [2:19:52<2:27:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4901/10070 [2:19:52<2:27:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4901/10070 [2:19:52<2:27:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4902/10070 [2:19:53<2:27:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4902/10070 [2:19:53<2:27:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4903/10070 [2:19:54<2:27:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4903/10070 [2:19:54<2:27:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4904/10070 [2:19:54<2:27:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4904/10070 [2:19:54<2:27:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4905/10070 [2:19:56<2:27:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4905/10070 [2:19:56<2:27:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4906/10070 [2:19:58<2:27:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4906/10070 [2:19:58<2:27:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4907/10070 [2:19:59<2:27:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4907/10070 [2:19:59<2:27:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4908/10070 [2:20:00<2:27:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4908/10070 [2:20:00<2:27:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4909/10070 [2:20:01<2:27:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4909/10070 [2:20:01<2:27:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4910/10070 [2:20:03<2:27:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4910/10070 [2:20:03<2:27:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4911/10070 [2:20:04<2:27:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4911/10070 [2:20:04<2:27:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4912/10070 [2:20:06<2:27:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4912/10070 [2:20:06<2:27:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4913/10070 [2:20:07<2:27:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4913/10070 [2:20:07<2:27:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4914/10070 [2:20:09<2:27:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4914/10070 [2:20:09<2:27:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4915/10070 [2:20:10<2:27:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4915/10070 [2:20:10<2:27:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4916/10070 [2:20:12<2:27:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4916/10070 [2:20:12<2:27:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4917/10070 [2:20:13<2:26:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4917/10070 [2:20:13<2:26:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4918/10070 [2:20:14<2:26:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4918/10070 [2:20:14<2:26:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4919/10070 [2:20:15<2:26:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4919/10070 [2:20:15<2:26:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4920/10070 [2:20:17<2:26:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4920/10070 [2:20:17<2:26:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4921/10070 [2:20:19<2:26:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4921/10070 [2:20:19<2:26:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4922/10070 [2:20:19<2:26:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4922/10070 [2:20:19<2:26:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4923/10070 [2:20:20<2:26:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4923/10070 [2:20:20<2:26:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4924/10070 [2:20:21<2:26:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4924/10070 [2:20:21<2:26:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4925/10070 [2:20:22<2:26:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4925/10070 [2:20:22<2:26:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4926/10070 [2:20:23<2:26:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4926/10070 [2:20:23<2:26:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4927/10070 [2:20:25<2:26:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4927/10070 [2:20:25<2:26:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4928/10070 [2:20:39<2:26:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4928/10070 [2:20:39<2:26:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4929/10070 [2:20:40<2:26:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4929/10070 [2:20:40<2:26:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4930/10070 [2:20:42<2:26:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4930/10070 [2:20:42<2:26:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4931/10070 [2:20:42<2:26:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4931/10070 [2:20:42<2:26:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4932/10070 [2:20:44<2:26:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4932/10070 [2:20:44<2:26:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4933/10070 [2:20:46<2:26:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4933/10070 [2:20:46<2:26:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4934/10070 [2:20:46<2:26:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4934/10070 [2:20:46<2:26:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4935/10070 [2:20:47<2:26:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4935/10070 [2:20:47<2:26:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4936/10070 [2:20:49<2:26:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4936/10070 [2:20:49<2:26:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4937/10070 [2:20:50<2:26:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4937/10070 [2:20:50<2:26:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4938/10070 [2:20:50<2:26:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4938/10070 [2:20:50<2:26:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4939/10070 [2:20:51<2:26:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4939/10070 [2:20:51<2:26:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4940/10070 [2:20:53<2:26:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4940/10070 [2:20:53<2:26:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4941/10070 [2:20:55<2:26:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4941/10070 [2:20:55<2:26:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4942/10070 [2:20:56<2:26:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4942/10070 [2:20:56<2:26:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4943/10070 [2:20:58<2:26:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4943/10070 [2:20:58<2:26:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4944/10070 [2:21:00<2:26:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4944/10070 [2:21:00<2:26:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4945/10070 [2:21:02<2:26:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4945/10070 [2:21:02<2:26:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4946/10070 [2:21:03<2:26:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4946/10070 [2:21:03<2:26:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4947/10070 [2:21:05<2:26:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4947/10070 [2:21:05<2:26:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4948/10070 [2:21:07<2:26:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4948/10070 [2:21:07<2:26:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4949/10070 [2:21:09<2:26:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4949/10070 [2:21:09<2:26:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4950/10070 [2:21:10<2:26:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4950/10070 [2:21:10<2:26:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4951/10070 [2:21:11<2:25:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4951/10070 [2:21:11<2:25:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4952/10070 [2:21:13<2:25:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4952/10070 [2:21:13<2:25:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4953/10070 [2:21:14<2:25:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4953/10070 [2:21:14<2:25:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4954/10070 [2:21:15<2:25:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4954/10070 [2:21:15<2:25:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4955/10070 [2:21:15<2:25:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4955/10070 [2:21:15<2:25:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4956/10070 [2:21:17<2:25:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4956/10070 [2:21:17<2:25:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4957/10070 [2:21:18<2:25:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4957/10070 [2:21:18<2:25:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4958/10070 [2:21:19<2:25:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4958/10070 [2:21:19<2:25:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4959/10070 [2:21:19<2:25:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4959/10070 [2:21:19<2:25:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4960/10070 [2:21:36<2:25:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4960/10070 [2:21:36<2:25:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4961/10070 [2:21:37<2:25:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4961/10070 [2:21:37<2:25:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4962/10070 [2:21:38<2:25:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4962/10070 [2:21:38<2:25:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4963/10070 [2:21:40<2:25:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4963/10070 [2:21:40<2:25:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4964/10070 [2:21:42<2:25:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4964/10070 [2:21:42<2:25:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4965/10070 [2:21:43<2:25:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4965/10070 [2:21:43<2:25:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4966/10070 [2:21:44<2:25:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4966/10070 [2:21:44<2:25:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4967/10070 [2:21:46<2:25:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4967/10070 [2:21:46<2:25:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4968/10070 [2:21:47<2:25:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4968/10070 [2:21:47<2:25:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4969/10070 [2:21:49<2:25:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4969/10070 [2:21:49<2:25:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4970/10070 [2:21:50<2:25:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4970/10070 [2:21:50<2:25:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4971/10070 [2:21:52<2:25:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4971/10070 [2:21:52<2:25:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4972/10070 [2:21:53<2:25:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4972/10070 [2:21:53<2:25:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4973/10070 [2:21:55<2:25:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4973/10070 [2:21:55<2:25:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4974/10070 [2:21:57<2:25:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4974/10070 [2:21:57<2:25:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4975/10070 [2:21:59<2:25:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4975/10070 [2:21:59<2:25:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4976/10070 [2:22:02<2:25:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4976/10070 [2:22:02<2:25:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4977/10070 [2:22:02<2:25:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4977/10070 [2:22:02<2:25:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4978/10070 [2:22:03<2:25:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4978/10070 [2:22:03<2:25:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4979/10070 [2:22:05<2:25:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4979/10070 [2:22:05<2:25:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4980/10070 [2:22:07<2:25:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4980/10070 [2:22:07<2:25:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4981/10070 [2:22:07<2:25:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4981/10070 [2:22:07<2:25:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4982/10070 [2:22:08<2:25:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4982/10070 [2:22:08<2:25:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4983/10070 [2:22:10<2:25:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4983/10070 [2:22:10<2:25:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  49%|▍| 4984/10070 [2:22:11<2:25:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  49%|▍| 4984/10070 [2:22:11<2:25:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 4985/10070 [2:22:12<2:25:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 4985/10070 [2:22:12<2:25:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 4986/10070 [2:22:14<2:25:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 4986/10070 [2:22:14<2:25:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 4987/10070 [2:22:16<2:25:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 4987/10070 [2:22:16<2:25:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 4988/10070 [2:22:16<2:24:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 4988/10070 [2:22:16<2:24:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 4989/10070 [2:22:18<2:24:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 4989/10070 [2:22:18<2:24:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 4990/10070 [2:22:19<2:24:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 4990/10070 [2:22:19<2:24:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 4991/10070 [2:22:21<2:24:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 4991/10070 [2:22:21<2:24:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 4992/10070 [2:22:29<2:24:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 4992/10070 [2:22:29<2:24:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 4993/10070 [2:22:30<2:24:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 4993/10070 [2:22:30<2:24:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 4994/10070 [2:22:30<2:24:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 4994/10070 [2:22:30<2:24:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 4995/10070 [2:22:32<2:24:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 4995/10070 [2:22:32<2:24:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 4996/10070 [2:22:34<2:24:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 4996/10070 [2:22:34<2:24:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 4997/10070 [2:22:36<2:24:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 4997/10070 [2:22:36<2:24:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 4998/10070 [2:22:37<2:24:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 4998/10070 [2:22:37<2:24:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 4999/10070 [2:22:39<2:24:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 4999/10070 [2:22:39<2:24:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5000/10070 [2:22:40<2:24:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5000/10070 [2:22:40<2:24:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5001/10070 [2:22:41<2:24:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5001/10070 [2:22:41<2:24:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5002/10070 [2:22:43<2:24:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5002/10070 [2:22:43<2:24:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5003/10070 [2:22:45<2:24:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5003/10070 [2:22:45<2:24:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5004/10070 [2:22:46<2:24:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5004/10070 [2:22:46<2:24:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5005/10070 [2:22:47<2:24:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5005/10070 [2:22:47<2:24:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5006/10070 [2:22:50<2:24:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5006/10070 [2:22:50<2:24:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5007/10070 [2:22:50<2:24:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5007/10070 [2:22:50<2:24:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5008/10070 [2:22:52<2:24:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5008/10070 [2:22:52<2:24:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5009/10070 [2:22:54<2:24:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5009/10070 [2:22:54<2:24:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5010/10070 [2:22:55<2:24:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5010/10070 [2:22:55<2:24:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5011/10070 [2:22:56<2:24:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5011/10070 [2:22:56<2:24:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5012/10070 [2:22:57<2:24:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5012/10070 [2:22:57<2:24:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5013/10070 [2:23:00<2:24:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5013/10070 [2:23:00<2:24:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5014/10070 [2:23:02<2:24:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5014/10070 [2:23:02<2:24:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5015/10070 [2:23:02<2:24:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5015/10070 [2:23:02<2:24:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5016/10070 [2:23:04<2:24:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5016/10070 [2:23:04<2:24:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5017/10070 [2:23:05<2:24:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5017/10070 [2:23:05<2:24:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5018/10070 [2:23:07<2:24:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5018/10070 [2:23:07<2:24:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5019/10070 [2:23:08<2:24:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5019/10070 [2:23:08<2:24:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5020/10070 [2:23:11<2:24:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5020/10070 [2:23:11<2:24:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5021/10070 [2:23:12<2:24:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5021/10070 [2:23:12<2:24:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5022/10070 [2:23:14<2:23:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5022/10070 [2:23:14<2:23:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5023/10070 [2:23:15<2:23:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5023/10070 [2:23:15<2:23:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5024/10070 [2:23:27<2:24:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5024/10070 [2:23:27<2:24:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5025/10070 [2:23:29<2:24:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5025/10070 [2:23:29<2:24:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5026/10070 [2:23:30<2:24:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5026/10070 [2:23:30<2:24:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5027/10070 [2:23:31<2:23:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5027/10070 [2:23:31<2:23:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5028/10070 [2:23:33<2:23:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5028/10070 [2:23:33<2:23:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5029/10070 [2:23:35<2:23:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5029/10070 [2:23:35<2:23:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5030/10070 [2:23:36<2:23:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5030/10070 [2:23:36<2:23:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5031/10070 [2:23:38<2:23:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5031/10070 [2:23:38<2:23:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5032/10070 [2:23:39<2:23:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5032/10070 [2:23:39<2:23:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5033/10070 [2:23:40<2:23:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5033/10070 [2:23:40<2:23:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▍| 5034/10070 [2:23:41<2:23:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▍| 5034/10070 [2:23:41<2:23:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5035/10070 [2:23:43<2:23:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5035/10070 [2:23:43<2:23:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5036/10070 [2:23:44<2:23:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5036/10070 [2:23:44<2:23:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5037/10070 [2:23:46<2:23:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5037/10070 [2:23:46<2:23:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5038/10070 [2:23:47<2:23:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5038/10070 [2:23:47<2:23:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5039/10070 [2:23:48<2:23:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5039/10070 [2:23:48<2:23:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5040/10070 [2:23:49<2:23:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5040/10070 [2:23:49<2:23:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5041/10070 [2:23:50<2:23:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5041/10070 [2:23:50<2:23:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5042/10070 [2:23:51<2:23:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5042/10070 [2:23:51<2:23:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5043/10070 [2:23:52<2:23:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5043/10070 [2:23:52<2:23:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5044/10070 [2:23:54<2:23:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5044/10070 [2:23:54<2:23:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5045/10070 [2:23:56<2:23:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5045/10070 [2:23:56<2:23:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5046/10070 [2:23:57<2:23:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5046/10070 [2:23:57<2:23:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5047/10070 [2:23:59<2:23:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5047/10070 [2:23:59<2:23:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5048/10070 [2:24:00<2:23:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5048/10070 [2:24:00<2:23:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5049/10070 [2:24:01<2:23:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5049/10070 [2:24:01<2:23:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5050/10070 [2:24:01<2:23:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5050/10070 [2:24:01<2:23:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5051/10070 [2:24:03<2:23:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5051/10070 [2:24:03<2:23:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5052/10070 [2:24:03<2:23:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5052/10070 [2:24:03<2:23:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5053/10070 [2:24:05<2:23:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5053/10070 [2:24:05<2:23:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5054/10070 [2:24:06<2:23:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5054/10070 [2:24:06<2:23:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5055/10070 [2:24:08<2:22:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5055/10070 [2:24:08<2:22:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5056/10070 [2:24:23<2:23:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5056/10070 [2:24:23<2:23:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5057/10070 [2:24:26<2:23:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5057/10070 [2:24:26<2:23:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5058/10070 [2:24:27<2:23:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5058/10070 [2:24:27<2:23:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5059/10070 [2:24:30<2:23:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5059/10070 [2:24:30<2:23:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5060/10070 [2:24:31<2:23:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5060/10070 [2:24:31<2:23:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5061/10070 [2:24:32<2:23:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5061/10070 [2:24:32<2:23:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5062/10070 [2:24:34<2:23:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5062/10070 [2:24:34<2:23:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5063/10070 [2:24:36<2:23:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5063/10070 [2:24:36<2:23:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5064/10070 [2:24:38<2:22:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5064/10070 [2:24:38<2:22:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5065/10070 [2:24:40<2:22:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5065/10070 [2:24:40<2:22:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5066/10070 [2:24:42<2:22:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5066/10070 [2:24:42<2:22:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5067/10070 [2:24:42<2:22:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5067/10070 [2:24:42<2:22:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5068/10070 [2:24:44<2:22:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5068/10070 [2:24:44<2:22:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5069/10070 [2:24:45<2:22:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5069/10070 [2:24:45<2:22:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5070/10070 [2:24:47<2:22:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5070/10070 [2:24:47<2:22:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5071/10070 [2:24:48<2:22:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5071/10070 [2:24:48<2:22:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5072/10070 [2:24:49<2:22:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5072/10070 [2:24:49<2:22:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5073/10070 [2:24:52<2:22:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5073/10070 [2:24:52<2:22:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5074/10070 [2:24:52<2:22:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5074/10070 [2:24:52<2:22:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5075/10070 [2:24:54<2:22:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5075/10070 [2:24:54<2:22:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5076/10070 [2:24:56<2:22:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5076/10070 [2:24:56<2:22:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5077/10070 [2:24:58<2:22:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5077/10070 [2:24:58<2:22:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5078/10070 [2:24:58<2:22:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5078/10070 [2:24:58<2:22:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5079/10070 [2:24:59<2:22:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5079/10070 [2:24:59<2:22:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5080/10070 [2:25:01<2:22:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5080/10070 [2:25:01<2:22:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5081/10070 [2:25:02<2:22:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5081/10070 [2:25:02<2:22:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5082/10070 [2:25:03<2:22:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5082/10070 [2:25:03<2:22:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5083/10070 [2:25:04<2:22:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5083/10070 [2:25:04<2:22:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5084/10070 [2:25:07<2:22:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5084/10070 [2:25:07<2:22:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  50%|▌| 5085/10070 [2:25:08<2:22:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  50%|▌| 5085/10070 [2:25:08<2:22:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5086/10070 [2:25:09<2:22:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5086/10070 [2:25:09<2:22:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5087/10070 [2:25:11<2:22:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5087/10070 [2:25:11<2:22:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5088/10070 [2:25:19<2:22:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5088/10070 [2:25:19<2:22:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5089/10070 [2:25:19<2:22:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5089/10070 [2:25:19<2:22:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5090/10070 [2:25:20<2:22:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5090/10070 [2:25:20<2:22:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5091/10070 [2:25:21<2:22:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5091/10070 [2:25:21<2:22:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5092/10070 [2:25:22<2:22:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5092/10070 [2:25:22<2:22:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5093/10070 [2:25:23<2:22:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5093/10070 [2:25:23<2:22:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5094/10070 [2:25:24<2:22:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5094/10070 [2:25:24<2:22:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5095/10070 [2:25:25<2:21:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5095/10070 [2:25:25<2:21:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5096/10070 [2:25:27<2:21:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5096/10070 [2:25:27<2:21:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5097/10070 [2:25:29<2:21:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5097/10070 [2:25:29<2:21:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5098/10070 [2:25:31<2:21:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5098/10070 [2:25:31<2:21:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5099/10070 [2:25:33<2:21:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5099/10070 [2:25:33<2:21:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5100/10070 [2:25:33<2:21:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5100/10070 [2:25:33<2:21:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5101/10070 [2:25:36<2:21:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5101/10070 [2:25:36<2:21:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5102/10070 [2:25:37<2:21:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5102/10070 [2:25:37<2:21:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5103/10070 [2:25:39<2:21:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5103/10070 [2:25:39<2:21:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5104/10070 [2:25:41<2:21:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5104/10070 [2:25:41<2:21:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5105/10070 [2:25:43<2:21:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5105/10070 [2:25:43<2:21:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5106/10070 [2:25:44<2:21:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5106/10070 [2:25:44<2:21:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5107/10070 [2:25:45<2:21:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5107/10070 [2:25:45<2:21:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5108/10070 [2:25:46<2:21:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5108/10070 [2:25:46<2:21:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5109/10070 [2:25:47<2:21:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5109/10070 [2:25:47<2:21:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5110/10070 [2:25:49<2:21:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5110/10070 [2:25:49<2:21:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5111/10070 [2:25:50<2:21:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5111/10070 [2:25:50<2:21:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5112/10070 [2:25:52<2:21:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5112/10070 [2:25:52<2:21:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5113/10070 [2:25:53<2:21:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5113/10070 [2:25:53<2:21:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5114/10070 [2:25:54<2:21:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5114/10070 [2:25:54<2:21:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5115/10070 [2:25:55<2:21:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5115/10070 [2:25:55<2:21:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5116/10070 [2:25:56<2:21:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5116/10070 [2:25:56<2:21:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5117/10070 [2:25:58<2:21:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5117/10070 [2:25:58<2:21:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5118/10070 [2:25:59<2:21:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5118/10070 [2:25:59<2:21:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5119/10070 [2:26:01<2:21:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5119/10070 [2:26:01<2:21:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5120/10070 [2:26:10<2:21:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5120/10070 [2:26:10<2:21:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5121/10070 [2:26:12<2:21:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5121/10070 [2:26:12<2:21:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5122/10070 [2:26:14<2:21:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5122/10070 [2:26:14<2:21:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5123/10070 [2:26:15<2:21:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5123/10070 [2:26:15<2:21:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5124/10070 [2:26:17<2:21:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5124/10070 [2:26:17<2:21:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5125/10070 [2:26:18<2:21:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5125/10070 [2:26:18<2:21:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5126/10070 [2:26:20<2:21:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5126/10070 [2:26:20<2:21:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5127/10070 [2:26:22<2:21:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5127/10070 [2:26:22<2:21:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5128/10070 [2:26:23<2:21:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5128/10070 [2:26:23<2:21:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5129/10070 [2:26:25<2:21:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5129/10070 [2:26:25<2:21:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5130/10070 [2:26:26<2:21:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5130/10070 [2:26:26<2:21:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5131/10070 [2:26:28<2:20:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5131/10070 [2:26:28<2:20:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5132/10070 [2:26:31<2:20:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5132/10070 [2:26:31<2:20:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5133/10070 [2:26:31<2:20:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5133/10070 [2:26:31<2:20:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5134/10070 [2:26:32<2:20:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5134/10070 [2:26:32<2:20:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5135/10070 [2:26:33<2:20:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5135/10070 [2:26:33<2:20:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5136/10070 [2:26:35<2:20:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5136/10070 [2:26:35<2:20:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5137/10070 [2:26:36<2:20:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5137/10070 [2:26:36<2:20:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5138/10070 [2:26:38<2:20:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5138/10070 [2:26:38<2:20:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5139/10070 [2:26:39<2:20:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5139/10070 [2:26:39<2:20:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5140/10070 [2:26:40<2:20:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5140/10070 [2:26:40<2:20:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5141/10070 [2:26:42<2:20:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5141/10070 [2:26:42<2:20:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5142/10070 [2:26:43<2:20:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5142/10070 [2:26:43<2:20:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5143/10070 [2:26:45<2:20:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5143/10070 [2:26:45<2:20:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5144/10070 [2:26:47<2:20:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5144/10070 [2:26:47<2:20:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5145/10070 [2:26:48<2:20:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5145/10070 [2:26:48<2:20:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5146/10070 [2:26:49<2:20:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5146/10070 [2:26:49<2:20:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5147/10070 [2:26:50<2:20:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5147/10070 [2:26:50<2:20:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5148/10070 [2:26:52<2:20:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5148/10070 [2:26:52<2:20:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5149/10070 [2:26:55<2:20:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5149/10070 [2:26:55<2:20:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5150/10070 [2:26:56<2:20:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5150/10070 [2:26:56<2:20:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5151/10070 [2:26:57<2:20:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5151/10070 [2:26:57<2:20:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5152/10070 [2:27:04<2:20:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5152/10070 [2:27:04<2:20:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5153/10070 [2:27:05<2:20:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5153/10070 [2:27:05<2:20:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5154/10070 [2:27:07<2:20:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5154/10070 [2:27:07<2:20:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5155/10070 [2:27:09<2:20:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5155/10070 [2:27:09<2:20:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5156/10070 [2:27:12<2:20:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5156/10070 [2:27:12<2:20:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5157/10070 [2:27:13<2:20:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5157/10070 [2:27:13<2:20:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5158/10070 [2:27:15<2:20:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5158/10070 [2:27:15<2:20:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5159/10070 [2:27:17<2:20:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5159/10070 [2:27:17<2:20:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5160/10070 [2:27:18<2:20:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5160/10070 [2:27:18<2:20:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5161/10070 [2:27:20<2:20:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5161/10070 [2:27:20<2:20:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5162/10070 [2:27:20<2:20:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5162/10070 [2:27:20<2:20:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5163/10070 [2:27:22<2:20:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5163/10070 [2:27:22<2:20:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5164/10070 [2:27:23<2:20:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5164/10070 [2:27:23<2:20:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5165/10070 [2:27:26<2:20:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5165/10070 [2:27:26<2:20:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5166/10070 [2:27:27<2:19:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5166/10070 [2:27:27<2:19:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5167/10070 [2:27:27<2:19:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5167/10070 [2:27:27<2:19:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5168/10070 [2:27:29<2:19:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5168/10070 [2:27:29<2:19:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5169/10070 [2:27:30<2:19:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5169/10070 [2:27:30<2:19:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5170/10070 [2:27:31<2:19:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5170/10070 [2:27:31<2:19:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5171/10070 [2:27:33<2:19:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5171/10070 [2:27:33<2:19:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5172/10070 [2:27:33<2:19:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5172/10070 [2:27:33<2:19:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5173/10070 [2:27:35<2:19:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5173/10070 [2:27:35<2:19:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5174/10070 [2:27:37<2:19:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5174/10070 [2:27:37<2:19:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5175/10070 [2:27:39<2:19:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5175/10070 [2:27:39<2:19:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5176/10070 [2:27:41<2:19:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5176/10070 [2:27:41<2:19:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5177/10070 [2:27:43<2:19:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5177/10070 [2:27:43<2:19:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5178/10070 [2:27:45<2:19:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5178/10070 [2:27:45<2:19:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5179/10070 [2:27:46<2:19:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5179/10070 [2:27:46<2:19:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5180/10070 [2:27:48<2:19:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5180/10070 [2:27:48<2:19:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5181/10070 [2:27:48<2:19:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5181/10070 [2:27:48<2:19:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5182/10070 [2:27:51<2:19:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5182/10070 [2:27:51<2:19:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5183/10070 [2:27:52<2:19:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5183/10070 [2:27:52<2:19:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5184/10070 [2:28:01<2:19:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5184/10070 [2:28:01<2:19:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5185/10070 [2:28:02<2:19:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5185/10070 [2:28:02<2:19:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  51%|▌| 5186/10070 [2:28:03<2:19:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  51%|▌| 5186/10070 [2:28:03<2:19:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5187/10070 [2:28:04<2:19:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5187/10070 [2:28:04<2:19:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5188/10070 [2:28:04<2:19:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5188/10070 [2:28:04<2:19:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5189/10070 [2:28:06<2:19:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5189/10070 [2:28:06<2:19:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5190/10070 [2:28:07<2:19:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5190/10070 [2:28:07<2:19:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5191/10070 [2:28:09<2:19:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5191/10070 [2:28:09<2:19:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5192/10070 [2:28:11<2:19:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5192/10070 [2:28:11<2:19:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5193/10070 [2:28:12<2:19:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5193/10070 [2:28:12<2:19:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5194/10070 [2:28:14<2:19:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5194/10070 [2:28:14<2:19:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5195/10070 [2:28:15<2:19:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5195/10070 [2:28:15<2:19:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5196/10070 [2:28:16<2:19:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5196/10070 [2:28:16<2:19:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5197/10070 [2:28:17<2:19:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5197/10070 [2:28:17<2:19:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5198/10070 [2:28:18<2:19:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5198/10070 [2:28:18<2:19:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5199/10070 [2:28:20<2:18:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5199/10070 [2:28:20<2:18:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5200/10070 [2:28:20<2:18:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5200/10070 [2:28:20<2:18:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5201/10070 [2:28:21<2:18:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5201/10070 [2:28:21<2:18:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5202/10070 [2:28:22<2:18:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5202/10070 [2:28:22<2:18:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5203/10070 [2:28:23<2:18:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5203/10070 [2:28:23<2:18:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5204/10070 [2:28:24<2:18:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5204/10070 [2:28:24<2:18:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5205/10070 [2:28:26<2:18:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5205/10070 [2:28:26<2:18:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5206/10070 [2:28:26<2:18:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5206/10070 [2:28:26<2:18:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5207/10070 [2:28:29<2:18:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5207/10070 [2:28:29<2:18:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5208/10070 [2:28:30<2:18:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5208/10070 [2:28:30<2:18:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5209/10070 [2:28:32<2:18:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5209/10070 [2:28:32<2:18:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5210/10070 [2:28:33<2:18:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5210/10070 [2:28:33<2:18:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5211/10070 [2:28:33<2:18:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5211/10070 [2:28:33<2:18:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5212/10070 [2:28:35<2:18:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5212/10070 [2:28:35<2:18:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5213/10070 [2:28:36<2:18:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5213/10070 [2:28:36<2:18:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5214/10070 [2:28:38<2:18:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5214/10070 [2:28:38<2:18:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5215/10070 [2:28:38<2:18:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5215/10070 [2:28:38<2:18:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5216/10070 [2:28:54<2:18:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5216/10070 [2:28:54<2:18:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5217/10070 [2:28:55<2:18:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5217/10070 [2:28:55<2:18:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5218/10070 [2:28:57<2:18:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5218/10070 [2:28:57<2:18:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5219/10070 [2:29:00<2:18:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5219/10070 [2:29:00<2:18:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5220/10070 [2:29:02<2:18:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5220/10070 [2:29:02<2:18:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5221/10070 [2:29:03<2:18:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5221/10070 [2:29:03<2:18:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5222/10070 [2:29:05<2:18:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5222/10070 [2:29:05<2:18:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5223/10070 [2:29:06<2:18:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5223/10070 [2:29:06<2:18:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5224/10070 [2:29:07<2:18:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5224/10070 [2:29:07<2:18:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5225/10070 [2:29:09<2:18:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5225/10070 [2:29:09<2:18:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5226/10070 [2:29:12<2:18:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5226/10070 [2:29:12<2:18:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5227/10070 [2:29:14<2:18:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5227/10070 [2:29:14<2:18:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5228/10070 [2:29:16<2:18:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5228/10070 [2:29:16<2:18:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5229/10070 [2:29:17<2:18:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5229/10070 [2:29:17<2:18:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5230/10070 [2:29:19<2:18:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5230/10070 [2:29:19<2:18:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5231/10070 [2:29:20<2:18:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5231/10070 [2:29:20<2:18:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5232/10070 [2:29:22<2:18:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5232/10070 [2:29:22<2:18:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5233/10070 [2:29:23<2:18:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5233/10070 [2:29:23<2:18:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5234/10070 [2:29:24<2:18:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5234/10070 [2:29:24<2:18:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5235/10070 [2:29:25<2:18:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5235/10070 [2:29:25<2:18:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5236/10070 [2:29:25<2:17:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5236/10070 [2:29:25<2:17:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5237/10070 [2:29:26<2:17:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5237/10070 [2:29:26<2:17:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5238/10070 [2:29:27<2:17:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5238/10070 [2:29:27<2:17:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5239/10070 [2:29:28<2:17:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5239/10070 [2:29:28<2:17:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5240/10070 [2:29:29<2:17:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5240/10070 [2:29:29<2:17:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5241/10070 [2:29:30<2:17:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5241/10070 [2:29:30<2:17:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5242/10070 [2:29:31<2:17:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5242/10070 [2:29:31<2:17:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5243/10070 [2:29:32<2:17:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5243/10070 [2:29:32<2:17:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5244/10070 [2:29:33<2:17:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5244/10070 [2:29:33<2:17:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5245/10070 [2:29:35<2:17:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5245/10070 [2:29:35<2:17:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5246/10070 [2:29:36<2:17:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5246/10070 [2:29:36<2:17:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5247/10070 [2:29:38<2:17:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5247/10070 [2:29:38<2:17:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5248/10070 [2:29:50<2:17:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5248/10070 [2:29:50<2:17:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5249/10070 [2:29:50<2:17:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5249/10070 [2:29:50<2:17:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5250/10070 [2:29:53<2:17:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5250/10070 [2:29:53<2:17:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5251/10070 [2:29:53<2:17:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5251/10070 [2:29:53<2:17:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5252/10070 [2:29:54<2:17:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5252/10070 [2:29:54<2:17:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5253/10070 [2:29:55<2:17:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5253/10070 [2:29:55<2:17:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5254/10070 [2:29:57<2:17:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5254/10070 [2:29:57<2:17:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5255/10070 [2:29:59<2:17:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5255/10070 [2:29:59<2:17:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5256/10070 [2:30:00<2:17:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5256/10070 [2:30:00<2:17:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5257/10070 [2:30:01<2:17:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5257/10070 [2:30:01<2:17:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5258/10070 [2:30:02<2:17:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5258/10070 [2:30:02<2:17:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5259/10070 [2:30:03<2:17:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5259/10070 [2:30:03<2:17:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5260/10070 [2:30:04<2:17:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5260/10070 [2:30:04<2:17:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5261/10070 [2:30:07<2:17:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5261/10070 [2:30:07<2:17:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5262/10070 [2:30:07<2:17:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5262/10070 [2:30:07<2:17:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5263/10070 [2:30:08<2:17:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5263/10070 [2:30:08<2:17:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5264/10070 [2:30:09<2:17:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5264/10070 [2:30:09<2:17:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5265/10070 [2:30:11<2:17:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5265/10070 [2:30:11<2:17:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5266/10070 [2:30:13<2:17:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5266/10070 [2:30:13<2:17:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5267/10070 [2:30:14<2:17:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5267/10070 [2:30:14<2:17:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5268/10070 [2:30:15<2:16:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5268/10070 [2:30:15<2:16:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5269/10070 [2:30:16<2:16:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5269/10070 [2:30:16<2:16:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5270/10070 [2:30:18<2:16:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5270/10070 [2:30:18<2:16:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5271/10070 [2:30:18<2:16:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5271/10070 [2:30:18<2:16:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5272/10070 [2:30:21<2:16:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5272/10070 [2:30:21<2:16:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5273/10070 [2:30:21<2:16:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5273/10070 [2:30:21<2:16:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5274/10070 [2:30:22<2:16:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5274/10070 [2:30:22<2:16:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5275/10070 [2:30:23<2:16:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5275/10070 [2:30:23<2:16:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5276/10070 [2:30:23<2:16:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5276/10070 [2:30:23<2:16:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5277/10070 [2:30:24<2:16:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5277/10070 [2:30:24<2:16:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5278/10070 [2:30:26<2:16:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5278/10070 [2:30:26<2:16:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5279/10070 [2:30:27<2:16:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5279/10070 [2:30:27<2:16:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5280/10070 [2:30:41<2:16:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5280/10070 [2:30:41<2:16:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5281/10070 [2:30:42<2:16:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5281/10070 [2:30:42<2:16:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5282/10070 [2:30:43<2:16:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5282/10070 [2:30:43<2:16:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5283/10070 [2:30:45<2:16:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5283/10070 [2:30:45<2:16:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5284/10070 [2:30:47<2:16:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5284/10070 [2:30:47<2:16:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5285/10070 [2:30:48<2:16:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5285/10070 [2:30:48<2:16:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  52%|▌| 5286/10070 [2:30:49<2:16:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  52%|▌| 5286/10070 [2:30:49<2:16:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5287/10070 [2:30:51<2:16:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5287/10070 [2:30:51<2:16:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5288/10070 [2:30:52<2:16:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5288/10070 [2:30:52<2:16:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5289/10070 [2:30:53<2:16:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5289/10070 [2:30:53<2:16:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5290/10070 [2:30:54<2:16:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5290/10070 [2:30:54<2:16:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5291/10070 [2:30:56<2:16:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5291/10070 [2:30:56<2:16:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5292/10070 [2:30:57<2:16:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5292/10070 [2:30:57<2:16:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5293/10070 [2:30:59<2:16:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5293/10070 [2:30:59<2:16:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5294/10070 [2:31:00<2:16:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5294/10070 [2:31:00<2:16:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5295/10070 [2:31:01<2:16:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5295/10070 [2:31:01<2:16:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5296/10070 [2:31:02<2:16:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5296/10070 [2:31:02<2:16:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5297/10070 [2:31:02<2:16:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5297/10070 [2:31:02<2:16:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5298/10070 [2:31:04<2:16:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5298/10070 [2:31:04<2:16:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5299/10070 [2:31:06<2:16:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5299/10070 [2:31:06<2:16:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5300/10070 [2:31:08<2:16:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5300/10070 [2:31:08<2:16:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5301/10070 [2:31:09<2:15:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5301/10070 [2:31:09<2:15:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5302/10070 [2:31:10<2:15:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5302/10070 [2:31:10<2:15:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5303/10070 [2:31:12<2:15:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5303/10070 [2:31:12<2:15:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5304/10070 [2:31:13<2:15:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5304/10070 [2:31:13<2:15:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5305/10070 [2:31:15<2:15:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5305/10070 [2:31:15<2:15:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5306/10070 [2:31:16<2:15:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5306/10070 [2:31:16<2:15:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5307/10070 [2:31:16<2:15:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5307/10070 [2:31:16<2:15:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5308/10070 [2:31:18<2:15:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5308/10070 [2:31:18<2:15:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5309/10070 [2:31:20<2:15:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5309/10070 [2:31:20<2:15:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5310/10070 [2:31:22<2:15:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5310/10070 [2:31:22<2:15:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5311/10070 [2:31:22<2:15:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5311/10070 [2:31:22<2:15:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5312/10070 [2:31:33<2:15:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5312/10070 [2:31:33<2:15:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5313/10070 [2:31:35<2:15:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5313/10070 [2:31:35<2:15:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5314/10070 [2:31:38<2:15:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5314/10070 [2:31:38<2:15:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5315/10070 [2:31:39<2:15:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5315/10070 [2:31:39<2:15:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5316/10070 [2:31:41<2:15:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5316/10070 [2:31:41<2:15:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5317/10070 [2:31:43<2:15:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5317/10070 [2:31:43<2:15:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5318/10070 [2:31:46<2:15:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5318/10070 [2:31:46<2:15:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5319/10070 [2:31:48<2:15:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5319/10070 [2:31:48<2:15:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5320/10070 [2:31:49<2:15:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5320/10070 [2:31:49<2:15:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5321/10070 [2:31:50<2:15:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5321/10070 [2:31:50<2:15:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5322/10070 [2:31:51<2:15:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5322/10070 [2:31:51<2:15:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5323/10070 [2:31:53<2:15:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5323/10070 [2:31:53<2:15:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5324/10070 [2:31:55<2:15:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5324/10070 [2:31:55<2:15:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5325/10070 [2:31:57<2:15:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5325/10070 [2:31:57<2:15:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5326/10070 [2:31:59<2:15:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5326/10070 [2:31:59<2:15:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5327/10070 [2:32:00<2:15:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5327/10070 [2:32:00<2:15:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5328/10070 [2:32:00<2:15:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5328/10070 [2:32:00<2:15:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5329/10070 [2:32:01<2:15:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5329/10070 [2:32:01<2:15:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5330/10070 [2:32:03<2:15:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5330/10070 [2:32:03<2:15:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5331/10070 [2:32:06<2:15:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5331/10070 [2:32:06<2:15:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5332/10070 [2:32:06<2:15:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5332/10070 [2:32:06<2:15:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5333/10070 [2:32:07<2:15:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5333/10070 [2:32:07<2:15:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5334/10070 [2:32:09<2:15:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5334/10070 [2:32:09<2:15:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5335/10070 [2:32:09<2:15:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5335/10070 [2:32:09<2:15:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5336/10070 [2:32:10<2:15:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5336/10070 [2:32:10<2:15:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5337/10070 [2:32:12<2:14:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5337/10070 [2:32:12<2:14:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5338/10070 [2:32:13<2:14:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5338/10070 [2:32:13<2:14:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5339/10070 [2:32:14<2:14:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5339/10070 [2:32:14<2:14:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5340/10070 [2:32:15<2:14:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5340/10070 [2:32:15<2:14:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5341/10070 [2:32:17<2:14:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5341/10070 [2:32:17<2:14:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5342/10070 [2:32:18<2:14:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5342/10070 [2:32:18<2:14:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5343/10070 [2:32:19<2:14:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5343/10070 [2:32:19<2:14:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5344/10070 [2:32:30<2:14:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5344/10070 [2:32:30<2:14:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5345/10070 [2:32:30<2:14:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5345/10070 [2:32:30<2:14:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5346/10070 [2:32:33<2:14:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5346/10070 [2:32:33<2:14:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5347/10070 [2:32:34<2:14:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5347/10070 [2:32:34<2:14:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5348/10070 [2:32:35<2:14:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5348/10070 [2:32:35<2:14:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5349/10070 [2:32:37<2:14:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5349/10070 [2:32:37<2:14:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5350/10070 [2:32:37<2:14:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5350/10070 [2:32:37<2:14:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5351/10070 [2:32:38<2:14:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5351/10070 [2:32:38<2:14:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5352/10070 [2:32:39<2:14:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5352/10070 [2:32:39<2:14:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5353/10070 [2:32:41<2:14:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5353/10070 [2:32:41<2:14:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5354/10070 [2:32:42<2:14:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5354/10070 [2:32:42<2:14:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5355/10070 [2:32:43<2:14:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5355/10070 [2:32:43<2:14:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5356/10070 [2:32:45<2:14:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5356/10070 [2:32:45<2:14:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5357/10070 [2:32:46<2:14:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5357/10070 [2:32:46<2:14:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5358/10070 [2:32:47<2:14:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5358/10070 [2:32:47<2:14:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5359/10070 [2:32:48<2:14:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5359/10070 [2:32:48<2:14:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5360/10070 [2:32:49<2:14:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5360/10070 [2:32:49<2:14:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5361/10070 [2:32:50<2:14:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5361/10070 [2:32:50<2:14:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5362/10070 [2:32:52<2:14:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5362/10070 [2:32:52<2:14:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5363/10070 [2:32:53<2:14:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5363/10070 [2:32:53<2:14:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5364/10070 [2:32:55<2:14:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5364/10070 [2:32:55<2:14:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5365/10070 [2:32:56<2:14:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5365/10070 [2:32:56<2:14:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5366/10070 [2:32:58<2:14:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5366/10070 [2:32:58<2:14:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5367/10070 [2:33:01<2:14:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5367/10070 [2:33:01<2:14:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5368/10070 [2:33:01<2:14:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5368/10070 [2:33:01<2:14:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5369/10070 [2:33:02<2:14:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5369/10070 [2:33:02<2:14:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5370/10070 [2:33:03<2:13:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5370/10070 [2:33:03<2:13:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5371/10070 [2:33:05<2:13:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5371/10070 [2:33:05<2:13:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5372/10070 [2:33:06<2:13:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5372/10070 [2:33:06<2:13:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5373/10070 [2:33:09<2:13:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5373/10070 [2:33:09<2:13:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5374/10070 [2:33:10<2:13:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5374/10070 [2:33:10<2:13:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5375/10070 [2:33:12<2:13:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5375/10070 [2:33:12<2:13:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5376/10070 [2:33:24<2:13:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5376/10070 [2:33:24<2:13:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5377/10070 [2:33:26<2:13:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5377/10070 [2:33:26<2:13:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5378/10070 [2:33:27<2:13:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5378/10070 [2:33:27<2:13:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5379/10070 [2:33:29<2:13:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5379/10070 [2:33:29<2:13:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5380/10070 [2:33:30<2:13:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5380/10070 [2:33:30<2:13:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5381/10070 [2:33:32<2:13:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5381/10070 [2:33:32<2:13:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5382/10070 [2:33:33<2:13:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5382/10070 [2:33:33<2:13:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5383/10070 [2:33:34<2:13:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5383/10070 [2:33:34<2:13:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5384/10070 [2:33:35<2:13:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5384/10070 [2:33:35<2:13:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5385/10070 [2:33:36<2:13:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5385/10070 [2:33:36<2:13:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5386/10070 [2:33:37<2:13:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5386/10070 [2:33:37<2:13:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  53%|▌| 5387/10070 [2:33:38<2:13:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  53%|▌| 5387/10070 [2:33:38<2:13:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5388/10070 [2:33:40<2:13:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5388/10070 [2:33:40<2:13:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5389/10070 [2:33:41<2:13:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5389/10070 [2:33:41<2:13:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5390/10070 [2:33:43<2:13:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5390/10070 [2:33:43<2:13:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5391/10070 [2:33:45<2:13:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5391/10070 [2:33:45<2:13:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5392/10070 [2:33:48<2:13:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5392/10070 [2:33:48<2:13:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5393/10070 [2:33:48<2:13:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5393/10070 [2:33:48<2:13:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5394/10070 [2:33:50<2:13:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5394/10070 [2:33:50<2:13:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5395/10070 [2:33:52<2:13:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5395/10070 [2:33:52<2:13:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5396/10070 [2:33:52<2:13:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5396/10070 [2:33:52<2:13:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5397/10070 [2:33:54<2:13:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5397/10070 [2:33:54<2:13:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5398/10070 [2:33:55<2:13:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5398/10070 [2:33:55<2:13:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5399/10070 [2:33:56<2:13:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5399/10070 [2:33:56<2:13:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5400/10070 [2:33:57<2:13:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5400/10070 [2:33:57<2:13:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5401/10070 [2:33:58<2:13:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5401/10070 [2:33:58<2:13:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5402/10070 [2:34:00<2:13:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5402/10070 [2:34:00<2:13:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5403/10070 [2:34:01<2:13:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5403/10070 [2:34:01<2:13:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5404/10070 [2:34:03<2:13:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5404/10070 [2:34:03<2:13:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5405/10070 [2:34:05<2:12:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5405/10070 [2:34:05<2:12:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5406/10070 [2:34:06<2:12:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5406/10070 [2:34:06<2:12:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5407/10070 [2:34:07<2:12:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5407/10070 [2:34:07<2:12:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5408/10070 [2:34:19<2:13:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5408/10070 [2:34:19<2:13:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5409/10070 [2:34:20<2:12:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5409/10070 [2:34:20<2:12:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5410/10070 [2:34:22<2:12:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5410/10070 [2:34:22<2:12:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5411/10070 [2:34:23<2:12:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5411/10070 [2:34:23<2:12:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5412/10070 [2:34:25<2:12:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5412/10070 [2:34:25<2:12:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5413/10070 [2:34:26<2:12:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5413/10070 [2:34:26<2:12:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5414/10070 [2:34:28<2:12:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5414/10070 [2:34:28<2:12:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5415/10070 [2:34:29<2:12:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5415/10070 [2:34:29<2:12:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5416/10070 [2:34:30<2:12:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5416/10070 [2:34:30<2:12:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5417/10070 [2:34:32<2:12:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5417/10070 [2:34:32<2:12:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5418/10070 [2:34:33<2:12:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5418/10070 [2:34:33<2:12:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5419/10070 [2:34:35<2:12:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5419/10070 [2:34:35<2:12:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5420/10070 [2:34:38<2:12:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5420/10070 [2:34:38<2:12:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5421/10070 [2:34:38<2:12:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5421/10070 [2:34:38<2:12:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5422/10070 [2:34:40<2:12:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5422/10070 [2:34:40<2:12:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5423/10070 [2:34:42<2:12:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5423/10070 [2:34:42<2:12:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5424/10070 [2:34:43<2:12:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5424/10070 [2:34:43<2:12:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5425/10070 [2:34:44<2:12:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5425/10070 [2:34:44<2:12:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5426/10070 [2:34:46<2:12:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5426/10070 [2:34:46<2:12:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5427/10070 [2:34:47<2:12:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5427/10070 [2:34:47<2:12:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5428/10070 [2:34:49<2:12:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5428/10070 [2:34:49<2:12:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5429/10070 [2:34:49<2:12:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5429/10070 [2:34:49<2:12:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5430/10070 [2:34:51<2:12:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5430/10070 [2:34:51<2:12:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5431/10070 [2:34:52<2:12:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5431/10070 [2:34:52<2:12:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5432/10070 [2:34:52<2:12:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5432/10070 [2:34:52<2:12:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5433/10070 [2:34:55<2:12:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5433/10070 [2:34:55<2:12:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5434/10070 [2:34:56<2:12:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5434/10070 [2:34:56<2:12:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5435/10070 [2:34:57<2:12:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5435/10070 [2:34:57<2:12:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5436/10070 [2:34:59<2:12:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5436/10070 [2:34:59<2:12:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5437/10070 [2:35:01<2:12:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5437/10070 [2:35:01<2:12:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5438/10070 [2:35:03<2:12:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5438/10070 [2:35:03<2:12:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5439/10070 [2:35:04<2:12:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5439/10070 [2:35:04<2:12:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5440/10070 [2:35:11<2:12:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5440/10070 [2:35:11<2:12:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5441/10070 [2:35:13<2:12:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5441/10070 [2:35:13<2:12:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5442/10070 [2:35:14<2:12:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5442/10070 [2:35:14<2:12:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5443/10070 [2:35:15<2:11:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5443/10070 [2:35:15<2:11:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5444/10070 [2:35:16<2:11:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5444/10070 [2:35:16<2:11:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5445/10070 [2:35:17<2:11:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5445/10070 [2:35:17<2:11:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5446/10070 [2:35:17<2:11:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5446/10070 [2:35:17<2:11:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5447/10070 [2:35:19<2:11:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5447/10070 [2:35:19<2:11:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5448/10070 [2:35:19<2:11:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5448/10070 [2:35:19<2:11:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5449/10070 [2:35:20<2:11:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5449/10070 [2:35:20<2:11:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5450/10070 [2:35:20<2:11:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5450/10070 [2:35:20<2:11:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5451/10070 [2:35:22<2:11:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5451/10070 [2:35:22<2:11:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5452/10070 [2:35:23<2:11:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5452/10070 [2:35:23<2:11:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5453/10070 [2:35:25<2:11:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5453/10070 [2:35:25<2:11:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5454/10070 [2:35:27<2:11:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5454/10070 [2:35:27<2:11:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5455/10070 [2:35:28<2:11:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5455/10070 [2:35:28<2:11:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5456/10070 [2:35:29<2:11:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5456/10070 [2:35:29<2:11:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5457/10070 [2:35:31<2:11:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5457/10070 [2:35:31<2:11:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5458/10070 [2:35:32<2:11:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5458/10070 [2:35:32<2:11:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5459/10070 [2:35:34<2:11:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5459/10070 [2:35:34<2:11:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5460/10070 [2:35:35<2:11:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5460/10070 [2:35:35<2:11:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5461/10070 [2:35:35<2:11:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5461/10070 [2:35:35<2:11:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5462/10070 [2:35:37<2:11:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5462/10070 [2:35:37<2:11:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5463/10070 [2:35:38<2:11:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5463/10070 [2:35:38<2:11:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5464/10070 [2:35:40<2:11:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5464/10070 [2:35:40<2:11:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5465/10070 [2:35:40<2:11:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5465/10070 [2:35:40<2:11:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5466/10070 [2:35:41<2:11:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5466/10070 [2:35:41<2:11:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5467/10070 [2:35:42<2:11:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5467/10070 [2:35:42<2:11:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5468/10070 [2:35:43<2:11:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5468/10070 [2:35:43<2:11:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5469/10070 [2:35:45<2:11:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5469/10070 [2:35:45<2:11:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5470/10070 [2:35:46<2:10:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5470/10070 [2:35:46<2:10:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5471/10070 [2:35:46<2:10:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5471/10070 [2:35:46<2:10:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5472/10070 [2:36:04<2:11:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5472/10070 [2:36:04<2:11:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5473/10070 [2:36:05<2:11:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5473/10070 [2:36:05<2:11:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5474/10070 [2:36:08<2:11:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5474/10070 [2:36:08<2:11:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5475/10070 [2:36:10<2:11:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5475/10070 [2:36:10<2:11:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5476/10070 [2:36:11<2:11:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5476/10070 [2:36:11<2:11:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5477/10070 [2:36:12<2:10:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5477/10070 [2:36:12<2:10:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5478/10070 [2:36:13<2:10:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5478/10070 [2:36:13<2:10:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5479/10070 [2:36:15<2:10:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5479/10070 [2:36:15<2:10:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5480/10070 [2:36:16<2:10:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5480/10070 [2:36:16<2:10:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5481/10070 [2:36:17<2:10:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5481/10070 [2:36:17<2:10:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5482/10070 [2:36:19<2:10:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5482/10070 [2:36:19<2:10:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5483/10070 [2:36:21<2:10:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5483/10070 [2:36:21<2:10:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5484/10070 [2:36:23<2:10:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5484/10070 [2:36:23<2:10:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5485/10070 [2:36:24<2:10:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5485/10070 [2:36:24<2:10:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5486/10070 [2:36:25<2:10:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5486/10070 [2:36:25<2:10:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5487/10070 [2:36:26<2:10:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  54%|▌| 5487/10070 [2:36:26<2:10:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5488/10070 [2:36:28<2:10:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  54%|▌| 5488/10070 [2:36:28<2:10:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5489/10070 [2:36:28<2:10:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5489/10070 [2:36:28<2:10:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5490/10070 [2:36:30<2:10:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5490/10070 [2:36:30<2:10:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5491/10070 [2:36:31<2:10:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5491/10070 [2:36:31<2:10:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5492/10070 [2:36:33<2:10:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5492/10070 [2:36:33<2:10:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5493/10070 [2:36:35<2:10:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5493/10070 [2:36:35<2:10:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5494/10070 [2:36:35<2:10:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5494/10070 [2:36:35<2:10:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5495/10070 [2:36:37<2:10:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5495/10070 [2:36:37<2:10:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5496/10070 [2:36:38<2:10:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5496/10070 [2:36:38<2:10:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5497/10070 [2:36:39<2:10:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5497/10070 [2:36:39<2:10:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5498/10070 [2:36:41<2:10:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5498/10070 [2:36:41<2:10:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5499/10070 [2:36:41<2:10:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5499/10070 [2:36:41<2:10:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5500/10070 [2:36:42<2:10:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5500/10070 [2:36:42<2:10:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5501/10070 [2:36:43<2:10:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5501/10070 [2:36:43<2:10:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5502/10070 [2:36:44<2:10:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5502/10070 [2:36:44<2:10:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5503/10070 [2:36:47<2:10:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5503/10070 [2:36:47<2:10:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5504/10070 [2:37:01<2:10:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5504/10070 [2:37:01<2:10:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5505/10070 [2:37:03<2:10:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5505/10070 [2:37:03<2:10:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5506/10070 [2:37:06<2:10:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5506/10070 [2:37:06<2:10:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5507/10070 [2:37:08<2:10:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5507/10070 [2:37:08<2:10:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5508/10070 [2:37:10<2:10:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5508/10070 [2:37:10<2:10:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5509/10070 [2:37:11<2:10:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5509/10070 [2:37:11<2:10:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5510/10070 [2:37:12<2:10:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5510/10070 [2:37:12<2:10:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5511/10070 [2:37:14<2:10:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5511/10070 [2:37:14<2:10:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5512/10070 [2:37:15<2:10:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5512/10070 [2:37:15<2:10:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5513/10070 [2:37:16<2:09:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5513/10070 [2:37:16<2:09:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5514/10070 [2:37:16<2:09:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5514/10070 [2:37:16<2:09:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5515/10070 [2:37:19<2:09:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5515/10070 [2:37:19<2:09:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5516/10070 [2:37:21<2:09:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5516/10070 [2:37:21<2:09:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5517/10070 [2:37:22<2:09:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5517/10070 [2:37:22<2:09:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5518/10070 [2:37:25<2:09:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5518/10070 [2:37:25<2:09:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5519/10070 [2:37:26<2:09:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5519/10070 [2:37:26<2:09:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5520/10070 [2:37:26<2:09:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5520/10070 [2:37:26<2:09:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5521/10070 [2:37:27<2:09:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5521/10070 [2:37:27<2:09:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5522/10070 [2:37:28<2:09:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5522/10070 [2:37:28<2:09:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5523/10070 [2:37:31<2:09:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5523/10070 [2:37:31<2:09:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5524/10070 [2:37:33<2:09:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5524/10070 [2:37:33<2:09:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5525/10070 [2:37:34<2:09:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5525/10070 [2:37:34<2:09:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5526/10070 [2:37:35<2:09:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5526/10070 [2:37:35<2:09:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5527/10070 [2:37:36<2:09:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5527/10070 [2:37:36<2:09:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5528/10070 [2:37:37<2:09:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5528/10070 [2:37:37<2:09:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5529/10070 [2:37:38<2:09:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5529/10070 [2:37:38<2:09:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5530/10070 [2:37:39<2:09:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5530/10070 [2:37:39<2:09:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5531/10070 [2:37:41<2:09:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5531/10070 [2:37:41<2:09:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5532/10070 [2:37:42<2:09:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5532/10070 [2:37:42<2:09:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5533/10070 [2:37:43<2:09:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5533/10070 [2:37:43<2:09:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5534/10070 [2:37:45<2:09:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5534/10070 [2:37:45<2:09:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5535/10070 [2:37:47<2:09:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5535/10070 [2:37:47<2:09:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5536/10070 [2:37:54<2:09:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5536/10070 [2:37:54<2:09:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5537/10070 [2:37:55<2:09:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5537/10070 [2:37:55<2:09:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5538/10070 [2:37:57<2:09:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5538/10070 [2:37:57<2:09:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5539/10070 [2:37:57<2:09:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5539/10070 [2:37:57<2:09:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5540/10070 [2:37:58<2:09:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5540/10070 [2:37:58<2:09:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5541/10070 [2:37:59<2:09:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5541/10070 [2:37:59<2:09:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5542/10070 [2:38:01<2:09:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5542/10070 [2:38:01<2:09:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5543/10070 [2:38:02<2:09:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5543/10070 [2:38:02<2:09:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5544/10070 [2:38:04<2:09:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5544/10070 [2:38:04<2:09:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5545/10070 [2:38:05<2:09:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5545/10070 [2:38:05<2:09:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5546/10070 [2:38:06<2:08:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5546/10070 [2:38:06<2:08:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5547/10070 [2:38:08<2:08:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5547/10070 [2:38:08<2:08:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5548/10070 [2:38:08<2:08:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5548/10070 [2:38:08<2:08:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5549/10070 [2:38:09<2:08:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5549/10070 [2:38:09<2:08:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5550/10070 [2:38:11<2:08:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5550/10070 [2:38:11<2:08:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5551/10070 [2:38:12<2:08:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5551/10070 [2:38:12<2:08:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5552/10070 [2:38:13<2:08:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5552/10070 [2:38:13<2:08:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5553/10070 [2:38:15<2:08:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5553/10070 [2:38:15<2:08:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5554/10070 [2:38:16<2:08:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5554/10070 [2:38:16<2:08:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5555/10070 [2:38:17<2:08:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5555/10070 [2:38:17<2:08:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5556/10070 [2:38:19<2:08:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5556/10070 [2:38:19<2:08:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5557/10070 [2:38:21<2:08:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5557/10070 [2:38:21<2:08:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5558/10070 [2:38:22<2:08:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5558/10070 [2:38:22<2:08:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5559/10070 [2:38:23<2:08:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5559/10070 [2:38:23<2:08:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5560/10070 [2:38:24<2:08:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5560/10070 [2:38:24<2:08:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5561/10070 [2:38:25<2:08:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5561/10070 [2:38:25<2:08:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5562/10070 [2:38:27<2:08:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5562/10070 [2:38:27<2:08:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5563/10070 [2:38:29<2:08:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5563/10070 [2:38:29<2:08:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5564/10070 [2:38:31<2:08:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5564/10070 [2:38:31<2:08:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5565/10070 [2:38:32<2:08:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5565/10070 [2:38:32<2:08:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5566/10070 [2:38:34<2:08:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5566/10070 [2:38:34<2:08:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5567/10070 [2:38:35<2:08:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5567/10070 [2:38:35<2:08:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5568/10070 [2:38:49<2:08:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5568/10070 [2:38:49<2:08:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5569/10070 [2:38:50<2:08:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5569/10070 [2:38:50<2:08:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5570/10070 [2:38:51<2:08:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5570/10070 [2:38:51<2:08:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5571/10070 [2:38:52<2:08:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5571/10070 [2:38:52<2:08:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5572/10070 [2:38:53<2:08:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5572/10070 [2:38:53<2:08:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5573/10070 [2:38:54<2:08:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5573/10070 [2:38:54<2:08:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5574/10070 [2:38:55<2:08:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5574/10070 [2:38:55<2:08:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5575/10070 [2:38:58<2:08:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5575/10070 [2:38:58<2:08:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5576/10070 [2:38:58<2:08:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5576/10070 [2:38:58<2:08:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5577/10070 [2:39:00<2:08:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5577/10070 [2:39:00<2:08:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5578/10070 [2:39:02<2:08:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5578/10070 [2:39:02<2:08:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5579/10070 [2:39:03<2:08:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5579/10070 [2:39:03<2:08:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5580/10070 [2:39:04<2:07:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5580/10070 [2:39:04<2:07:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5581/10070 [2:39:04<2:07:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5581/10070 [2:39:04<2:07:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5582/10070 [2:39:06<2:07:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5582/10070 [2:39:06<2:07:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5583/10070 [2:39:08<2:07:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5583/10070 [2:39:08<2:07:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5584/10070 [2:39:09<2:07:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5584/10070 [2:39:09<2:07:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5585/10070 [2:39:10<2:07:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5585/10070 [2:39:10<2:07:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5586/10070 [2:39:11<2:07:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5586/10070 [2:39:11<2:07:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5587/10070 [2:39:12<2:07:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5587/10070 [2:39:12<2:07:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  55%|▌| 5588/10070 [2:39:13<2:07:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  55%|▌| 5588/10070 [2:39:13<2:07:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5589/10070 [2:39:14<2:07:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5589/10070 [2:39:14<2:07:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5590/10070 [2:39:16<2:07:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5590/10070 [2:39:16<2:07:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5591/10070 [2:39:18<2:07:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5591/10070 [2:39:18<2:07:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5592/10070 [2:39:19<2:07:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5592/10070 [2:39:19<2:07:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5593/10070 [2:39:19<2:07:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5593/10070 [2:39:19<2:07:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5594/10070 [2:39:20<2:07:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5594/10070 [2:39:20<2:07:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5595/10070 [2:39:22<2:07:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5595/10070 [2:39:22<2:07:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5596/10070 [2:39:23<2:07:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5596/10070 [2:39:23<2:07:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5597/10070 [2:39:25<2:07:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5597/10070 [2:39:25<2:07:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5598/10070 [2:39:27<2:07:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5598/10070 [2:39:27<2:07:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5599/10070 [2:39:28<2:07:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5599/10070 [2:39:28<2:07:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5600/10070 [2:39:42<2:07:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5600/10070 [2:39:42<2:07:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5601/10070 [2:40:03<2:07:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5601/10070 [2:40:03<2:07:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5602/10070 [2:40:03<2:07:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5602/10070 [2:40:03<2:07:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5603/10070 [2:40:05<2:07:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5603/10070 [2:40:05<2:07:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5604/10070 [2:40:06<2:07:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5604/10070 [2:40:06<2:07:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5605/10070 [2:40:09<2:07:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5605/10070 [2:40:09<2:07:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5606/10070 [2:40:09<2:07:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5606/10070 [2:40:09<2:07:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5607/10070 [2:40:11<2:07:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5607/10070 [2:40:11<2:07:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5608/10070 [2:40:11<2:07:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5608/10070 [2:40:11<2:07:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5609/10070 [2:40:12<2:07:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5609/10070 [2:40:12<2:07:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5610/10070 [2:40:13<2:07:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5610/10070 [2:40:13<2:07:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5611/10070 [2:40:14<2:07:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5611/10070 [2:40:14<2:07:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5612/10070 [2:40:15<2:07:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5612/10070 [2:40:15<2:07:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5613/10070 [2:40:16<2:07:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5613/10070 [2:40:16<2:07:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5614/10070 [2:40:18<2:07:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5614/10070 [2:40:18<2:07:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5615/10070 [2:40:20<2:07:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5615/10070 [2:40:20<2:07:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5616/10070 [2:40:21<2:07:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5616/10070 [2:40:21<2:07:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5617/10070 [2:40:22<2:07:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5617/10070 [2:40:22<2:07:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5618/10070 [2:40:24<2:07:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5618/10070 [2:40:24<2:07:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5619/10070 [2:40:25<2:07:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5619/10070 [2:40:25<2:07:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5620/10070 [2:40:27<2:07:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5620/10070 [2:40:27<2:07:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5621/10070 [2:40:30<2:07:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5621/10070 [2:40:30<2:07:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5622/10070 [2:40:30<2:06:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5622/10070 [2:40:30<2:06:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5623/10070 [2:40:32<2:06:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5623/10070 [2:40:32<2:06:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5624/10070 [2:40:34<2:06:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5624/10070 [2:40:34<2:06:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5625/10070 [2:40:36<2:06:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5625/10070 [2:40:36<2:06:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5626/10070 [2:40:37<2:06:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5626/10070 [2:40:37<2:06:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5627/10070 [2:40:39<2:06:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5627/10070 [2:40:39<2:06:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5628/10070 [2:40:42<2:06:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5628/10070 [2:40:42<2:06:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5629/10070 [2:40:44<2:06:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5629/10070 [2:40:44<2:06:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5630/10070 [2:40:46<2:06:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5630/10070 [2:40:46<2:06:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5631/10070 [2:40:48<2:06:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5631/10070 [2:40:48<2:06:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5632/10070 [2:40:55<2:06:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5632/10070 [2:40:55<2:06:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5633/10070 [2:40:58<2:06:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5633/10070 [2:40:58<2:06:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5634/10070 [2:40:59<2:06:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5634/10070 [2:40:59<2:06:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5635/10070 [2:41:01<2:06:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5635/10070 [2:41:01<2:06:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5636/10070 [2:41:02<2:06:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5636/10070 [2:41:02<2:06:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5637/10070 [2:41:03<2:06:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5637/10070 [2:41:03<2:06:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5638/10070 [2:41:03<2:06:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5638/10070 [2:41:03<2:06:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5639/10070 [2:41:04<2:06:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5639/10070 [2:41:04<2:06:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5640/10070 [2:41:06<2:06:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5640/10070 [2:41:06<2:06:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5641/10070 [2:41:08<2:06:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5641/10070 [2:41:08<2:06:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5642/10070 [2:41:10<2:06:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5642/10070 [2:41:10<2:06:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5643/10070 [2:41:11<2:06:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5643/10070 [2:41:11<2:06:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5644/10070 [2:41:12<2:06:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5644/10070 [2:41:12<2:06:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5645/10070 [2:41:14<2:06:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5645/10070 [2:41:14<2:06:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5646/10070 [2:41:16<2:06:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5646/10070 [2:41:16<2:06:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5647/10070 [2:41:16<2:06:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5647/10070 [2:41:16<2:06:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5648/10070 [2:41:17<2:06:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5648/10070 [2:41:17<2:06:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5649/10070 [2:41:18<2:06:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5649/10070 [2:41:18<2:06:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5650/10070 [2:41:19<2:06:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5650/10070 [2:41:19<2:06:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5651/10070 [2:41:21<2:06:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5651/10070 [2:41:21<2:06:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5652/10070 [2:41:23<2:06:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5652/10070 [2:41:23<2:06:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5653/10070 [2:41:26<2:06:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5653/10070 [2:41:26<2:06:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5654/10070 [2:41:27<2:06:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5654/10070 [2:41:27<2:06:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5655/10070 [2:41:29<2:06:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5655/10070 [2:41:29<2:06:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5656/10070 [2:41:29<2:06:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5656/10070 [2:41:29<2:06:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5657/10070 [2:41:31<2:06:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5657/10070 [2:41:31<2:06:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5658/10070 [2:41:33<2:05:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5658/10070 [2:41:33<2:05:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5659/10070 [2:41:35<2:05:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5659/10070 [2:41:35<2:05:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5660/10070 [2:41:36<2:05:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5660/10070 [2:41:36<2:05:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5661/10070 [2:41:36<2:05:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5661/10070 [2:41:36<2:05:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5662/10070 [2:41:39<2:05:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5662/10070 [2:41:39<2:05:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5663/10070 [2:41:41<2:05:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5663/10070 [2:41:41<2:05:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5664/10070 [2:41:48<2:05:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5664/10070 [2:41:48<2:05:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5665/10070 [2:41:49<2:05:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5665/10070 [2:41:49<2:05:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5666/10070 [2:41:50<2:05:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5666/10070 [2:41:50<2:05:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5667/10070 [2:41:52<2:05:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5667/10070 [2:41:52<2:05:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5668/10070 [2:41:53<2:05:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5668/10070 [2:41:53<2:05:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5669/10070 [2:41:55<2:05:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5669/10070 [2:41:55<2:05:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5670/10070 [2:41:56<2:05:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5670/10070 [2:41:56<2:05:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5671/10070 [2:41:58<2:05:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5671/10070 [2:41:58<2:05:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5672/10070 [2:42:00<2:05:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5672/10070 [2:42:00<2:05:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5673/10070 [2:42:02<2:05:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5673/10070 [2:42:02<2:05:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5674/10070 [2:42:04<2:05:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5674/10070 [2:42:04<2:05:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5675/10070 [2:42:06<2:05:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5675/10070 [2:42:06<2:05:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5676/10070 [2:42:07<2:05:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5676/10070 [2:42:07<2:05:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5677/10070 [2:42:09<2:05:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5677/10070 [2:42:09<2:05:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5678/10070 [2:42:11<2:05:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5678/10070 [2:42:11<2:05:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5679/10070 [2:42:13<2:05:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5679/10070 [2:42:13<2:05:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5680/10070 [2:42:15<2:05:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5680/10070 [2:42:15<2:05:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5681/10070 [2:42:16<2:05:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5681/10070 [2:42:16<2:05:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5682/10070 [2:42:18<2:05:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5682/10070 [2:42:18<2:05:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5683/10070 [2:42:19<2:05:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5683/10070 [2:42:19<2:05:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5684/10070 [2:42:20<2:05:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5684/10070 [2:42:20<2:05:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5685/10070 [2:42:20<2:05:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5685/10070 [2:42:20<2:05:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5686/10070 [2:42:22<2:05:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5686/10070 [2:42:22<2:05:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5687/10070 [2:42:23<2:05:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5687/10070 [2:42:23<2:05:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5688/10070 [2:42:25<2:05:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5688/10070 [2:42:25<2:05:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  56%|▌| 5689/10070 [2:42:26<2:05:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  56%|▌| 5689/10070 [2:42:26<2:05:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5690/10070 [2:42:27<2:05:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5690/10070 [2:42:27<2:05:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5691/10070 [2:42:28<2:05:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5691/10070 [2:42:28<2:05:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5692/10070 [2:42:30<2:04:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5692/10070 [2:42:30<2:04:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5693/10070 [2:42:31<2:04:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5693/10070 [2:42:31<2:04:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5694/10070 [2:42:33<2:04:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5694/10070 [2:42:33<2:04:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5695/10070 [2:42:35<2:04:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5695/10070 [2:42:35<2:04:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5696/10070 [2:42:43<2:04:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5696/10070 [2:42:43<2:04:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5697/10070 [2:42:44<2:04:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5697/10070 [2:42:44<2:04:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5698/10070 [2:42:45<2:04:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5698/10070 [2:42:45<2:04:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5699/10070 [2:42:48<2:04:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5699/10070 [2:42:48<2:04:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5700/10070 [2:42:49<2:04:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5700/10070 [2:42:49<2:04:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5701/10070 [2:42:51<2:04:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5701/10070 [2:42:51<2:04:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5702/10070 [2:42:51<2:04:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5702/10070 [2:42:51<2:04:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5703/10070 [2:42:53<2:04:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5703/10070 [2:42:53<2:04:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5704/10070 [2:42:55<2:04:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5704/10070 [2:42:55<2:04:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5705/10070 [2:42:57<2:04:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5705/10070 [2:42:57<2:04:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5706/10070 [2:42:58<2:04:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5706/10070 [2:42:58<2:04:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5707/10070 [2:42:59<2:04:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5707/10070 [2:42:59<2:04:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5708/10070 [2:43:00<2:04:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5708/10070 [2:43:00<2:04:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5709/10070 [2:43:01<2:04:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5709/10070 [2:43:01<2:04:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5710/10070 [2:43:03<2:04:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5710/10070 [2:43:03<2:04:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5711/10070 [2:43:04<2:04:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5711/10070 [2:43:04<2:04:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5712/10070 [2:43:05<2:04:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5712/10070 [2:43:05<2:04:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5713/10070 [2:43:06<2:04:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5713/10070 [2:43:06<2:04:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5714/10070 [2:43:07<2:04:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5714/10070 [2:43:07<2:04:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5715/10070 [2:43:07<2:04:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5715/10070 [2:43:07<2:04:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5716/10070 [2:43:09<2:04:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5716/10070 [2:43:09<2:04:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5717/10070 [2:43:11<2:04:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5717/10070 [2:43:11<2:04:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5718/10070 [2:43:12<2:04:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5718/10070 [2:43:12<2:04:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5719/10070 [2:43:13<2:04:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5719/10070 [2:43:13<2:04:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5720/10070 [2:43:15<2:04:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5720/10070 [2:43:15<2:04:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5721/10070 [2:43:16<2:04:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5721/10070 [2:43:16<2:04:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5722/10070 [2:43:18<2:04:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5722/10070 [2:43:18<2:04:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5723/10070 [2:43:19<2:04:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5723/10070 [2:43:19<2:04:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5724/10070 [2:43:19<2:04:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5724/10070 [2:43:19<2:04:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5725/10070 [2:43:21<2:03:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5725/10070 [2:43:21<2:03:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5726/10070 [2:43:23<2:03:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5726/10070 [2:43:23<2:03:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5727/10070 [2:43:23<2:03:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5727/10070 [2:43:23<2:03:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5728/10070 [2:43:37<2:04:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5728/10070 [2:43:37<2:04:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5729/10070 [2:43:38<2:04:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5729/10070 [2:43:38<2:04:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5730/10070 [2:43:41<2:03:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5730/10070 [2:43:41<2:03:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5731/10070 [2:43:42<2:03:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5731/10070 [2:43:42<2:03:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5732/10070 [2:43:44<2:03:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5732/10070 [2:43:44<2:03:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5733/10070 [2:43:45<2:03:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5733/10070 [2:43:45<2:03:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5734/10070 [2:43:47<2:03:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5734/10070 [2:43:47<2:03:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5735/10070 [2:43:48<2:03:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5735/10070 [2:43:48<2:03:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5736/10070 [2:43:49<2:03:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5736/10070 [2:43:49<2:03:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5737/10070 [2:43:51<2:03:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5737/10070 [2:43:51<2:03:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5738/10070 [2:43:52<2:03:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5738/10070 [2:43:52<2:03:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5739/10070 [2:43:54<2:03:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5739/10070 [2:43:54<2:03:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5740/10070 [2:43:55<2:03:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5740/10070 [2:43:55<2:03:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5741/10070 [2:43:55<2:03:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5741/10070 [2:43:55<2:03:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5742/10070 [2:43:57<2:03:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5742/10070 [2:43:57<2:03:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5743/10070 [2:43:59<2:03:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5743/10070 [2:43:59<2:03:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5744/10070 [2:44:01<2:03:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5744/10070 [2:44:01<2:03:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5745/10070 [2:44:03<2:03:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5745/10070 [2:44:03<2:03:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5746/10070 [2:44:05<2:03:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5746/10070 [2:44:05<2:03:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5747/10070 [2:44:06<2:03:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5747/10070 [2:44:06<2:03:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5748/10070 [2:44:07<2:03:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5748/10070 [2:44:07<2:03:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5749/10070 [2:44:09<2:03:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5749/10070 [2:44:09<2:03:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5750/10070 [2:44:11<2:03:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5750/10070 [2:44:11<2:03:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5751/10070 [2:44:12<2:03:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5751/10070 [2:44:12<2:03:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5752/10070 [2:44:14<2:03:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5752/10070 [2:44:14<2:03:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5753/10070 [2:44:16<2:03:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5753/10070 [2:44:16<2:03:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5754/10070 [2:44:18<2:03:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5754/10070 [2:44:18<2:03:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5755/10070 [2:44:19<2:03:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5755/10070 [2:44:19<2:03:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5756/10070 [2:44:21<2:03:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5756/10070 [2:44:21<2:03:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5757/10070 [2:44:21<2:03:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5757/10070 [2:44:21<2:03:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5758/10070 [2:44:23<2:03:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5758/10070 [2:44:23<2:03:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5759/10070 [2:44:25<2:03:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5759/10070 [2:44:25<2:03:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5760/10070 [2:44:32<2:03:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5760/10070 [2:44:32<2:03:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5761/10070 [2:44:35<2:03:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5761/10070 [2:44:35<2:03:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5762/10070 [2:44:36<2:03:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5762/10070 [2:44:36<2:03:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5763/10070 [2:44:36<2:03:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5763/10070 [2:44:36<2:03:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5764/10070 [2:44:39<2:03:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5764/10070 [2:44:39<2:03:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5765/10070 [2:44:39<2:02:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5765/10070 [2:44:39<2:02:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5766/10070 [2:44:40<2:02:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5766/10070 [2:44:40<2:02:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5767/10070 [2:44:41<2:02:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5767/10070 [2:44:41<2:02:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5768/10070 [2:44:41<2:02:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5768/10070 [2:44:41<2:02:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5769/10070 [2:44:42<2:02:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5769/10070 [2:44:42<2:02:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5770/10070 [2:44:44<2:02:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5770/10070 [2:44:44<2:02:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5771/10070 [2:44:45<2:02:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5771/10070 [2:44:45<2:02:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5772/10070 [2:44:46<2:02:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5772/10070 [2:44:46<2:02:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5773/10070 [2:44:48<2:02:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5773/10070 [2:44:48<2:02:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5774/10070 [2:44:50<2:02:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5774/10070 [2:44:50<2:02:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5775/10070 [2:44:51<2:02:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5775/10070 [2:44:51<2:02:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5776/10070 [2:44:53<2:02:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5776/10070 [2:44:53<2:02:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5777/10070 [2:44:54<2:02:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5777/10070 [2:44:54<2:02:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5778/10070 [2:44:57<2:02:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5778/10070 [2:44:57<2:02:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5779/10070 [2:44:57<2:02:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5779/10070 [2:44:57<2:02:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5780/10070 [2:44:58<2:02:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5780/10070 [2:44:58<2:02:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5781/10070 [2:45:00<2:02:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5781/10070 [2:45:00<2:02:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5782/10070 [2:45:01<2:02:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5782/10070 [2:45:01<2:02:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5783/10070 [2:45:04<2:02:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5783/10070 [2:45:04<2:02:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5784/10070 [2:45:05<2:02:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5784/10070 [2:45:05<2:02:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5785/10070 [2:45:07<2:02:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5785/10070 [2:45:07<2:02:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5786/10070 [2:45:08<2:02:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5786/10070 [2:45:08<2:02:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5787/10070 [2:45:08<2:02:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5787/10070 [2:45:08<2:02:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5788/10070 [2:45:09<2:02:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5788/10070 [2:45:09<2:02:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5789/10070 [2:45:11<2:02:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5789/10070 [2:45:11<2:02:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  57%|▌| 5790/10070 [2:45:12<2:02:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  57%|▌| 5790/10070 [2:45:12<2:02:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5791/10070 [2:45:15<2:02:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5791/10070 [2:45:15<2:02:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5792/10070 [2:45:23<2:02:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5792/10070 [2:45:23<2:02:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5793/10070 [2:45:24<2:02:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5793/10070 [2:45:24<2:02:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5794/10070 [2:45:25<2:02:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5794/10070 [2:45:25<2:02:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5795/10070 [2:45:27<2:02:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5795/10070 [2:45:27<2:02:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5796/10070 [2:45:29<2:02:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5796/10070 [2:45:29<2:02:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5797/10070 [2:45:29<2:01:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5797/10070 [2:45:29<2:01:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5798/10070 [2:45:31<2:01:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5798/10070 [2:45:31<2:01:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5799/10070 [2:45:31<2:01:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5799/10070 [2:45:31<2:01:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5800/10070 [2:45:32<2:01:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5800/10070 [2:45:32<2:01:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5801/10070 [2:45:33<2:01:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5801/10070 [2:45:33<2:01:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5802/10070 [2:45:34<2:01:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5802/10070 [2:45:34<2:01:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5803/10070 [2:45:34<2:01:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5803/10070 [2:45:34<2:01:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5804/10070 [2:45:37<2:01:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5804/10070 [2:45:37<2:01:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5805/10070 [2:45:38<2:01:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5805/10070 [2:45:38<2:01:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5806/10070 [2:45:40<2:01:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5806/10070 [2:45:40<2:01:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5807/10070 [2:45:41<2:01:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5807/10070 [2:45:41<2:01:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5808/10070 [2:45:42<2:01:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5808/10070 [2:45:42<2:01:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5809/10070 [2:45:44<2:01:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5809/10070 [2:45:44<2:01:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5810/10070 [2:45:45<2:01:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5810/10070 [2:45:45<2:01:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5811/10070 [2:45:46<2:01:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5811/10070 [2:45:46<2:01:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5812/10070 [2:45:47<2:01:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5812/10070 [2:45:47<2:01:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5813/10070 [2:45:48<2:01:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5813/10070 [2:45:48<2:01:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5814/10070 [2:45:49<2:01:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5814/10070 [2:45:49<2:01:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5815/10070 [2:45:50<2:01:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5815/10070 [2:45:50<2:01:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5816/10070 [2:45:52<2:01:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5816/10070 [2:45:52<2:01:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5817/10070 [2:45:54<2:01:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5817/10070 [2:45:54<2:01:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5818/10070 [2:45:56<2:01:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5818/10070 [2:45:56<2:01:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5819/10070 [2:45:57<2:01:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5819/10070 [2:45:57<2:01:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5820/10070 [2:45:59<2:01:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5820/10070 [2:45:59<2:01:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5821/10070 [2:46:01<2:01:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5821/10070 [2:46:01<2:01:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5822/10070 [2:46:03<2:01:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5822/10070 [2:46:03<2:01:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5823/10070 [2:46:05<2:01:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5823/10070 [2:46:05<2:01:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5824/10070 [2:46:15<2:01:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5824/10070 [2:46:15<2:01:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5825/10070 [2:46:17<2:01:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5825/10070 [2:46:17<2:01:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5826/10070 [2:46:18<2:01:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5826/10070 [2:46:18<2:01:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5827/10070 [2:46:20<2:01:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5827/10070 [2:46:20<2:01:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5828/10070 [2:46:21<2:01:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5828/10070 [2:46:21<2:01:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5829/10070 [2:46:22<2:01:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5829/10070 [2:46:22<2:01:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5830/10070 [2:46:23<2:01:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5830/10070 [2:46:23<2:01:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5831/10070 [2:46:25<2:00:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5831/10070 [2:46:25<2:00:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5832/10070 [2:46:28<2:00:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5832/10070 [2:46:28<2:00:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5833/10070 [2:46:29<2:00:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5833/10070 [2:46:29<2:00:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5834/10070 [2:46:30<2:00:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5834/10070 [2:46:30<2:00:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5835/10070 [2:46:31<2:00:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5835/10070 [2:46:31<2:00:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5836/10070 [2:46:33<2:00:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5836/10070 [2:46:33<2:00:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5837/10070 [2:46:34<2:00:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5837/10070 [2:46:34<2:00:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5838/10070 [2:46:35<2:00:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5838/10070 [2:46:35<2:00:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5839/10070 [2:46:36<2:00:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5839/10070 [2:46:36<2:00:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5840/10070 [2:46:39<2:00:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5840/10070 [2:46:39<2:00:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5841/10070 [2:46:40<2:00:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5841/10070 [2:46:40<2:00:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5842/10070 [2:46:42<2:00:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5842/10070 [2:46:42<2:00:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5843/10070 [2:46:43<2:00:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5843/10070 [2:46:43<2:00:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5844/10070 [2:46:45<2:00:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5844/10070 [2:46:45<2:00:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5845/10070 [2:46:47<2:00:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5845/10070 [2:46:47<2:00:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5846/10070 [2:46:48<2:00:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5846/10070 [2:46:48<2:00:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5847/10070 [2:46:50<2:00:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5847/10070 [2:46:50<2:00:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5848/10070 [2:46:51<2:00:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5848/10070 [2:46:51<2:00:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5849/10070 [2:46:53<2:00:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5849/10070 [2:46:53<2:00:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5850/10070 [2:46:54<2:00:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5850/10070 [2:46:54<2:00:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5851/10070 [2:46:56<2:00:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5851/10070 [2:46:56<2:00:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5852/10070 [2:46:57<2:00:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5852/10070 [2:46:57<2:00:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5853/10070 [2:46:59<2:00:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5853/10070 [2:46:59<2:00:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5854/10070 [2:47:02<2:00:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5854/10070 [2:47:02<2:00:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5855/10070 [2:47:02<2:00:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5855/10070 [2:47:02<2:00:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5856/10070 [2:47:09<2:00:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5856/10070 [2:47:09<2:00:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5857/10070 [2:47:10<2:00:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5857/10070 [2:47:10<2:00:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5858/10070 [2:47:11<2:00:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5858/10070 [2:47:11<2:00:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5859/10070 [2:47:12<2:00:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5859/10070 [2:47:12<2:00:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5860/10070 [2:47:12<2:00:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5860/10070 [2:47:12<2:00:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5861/10070 [2:47:13<2:00:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5861/10070 [2:47:13<2:00:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5862/10070 [2:47:14<2:00:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5862/10070 [2:47:14<2:00:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5863/10070 [2:47:15<2:00:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5863/10070 [2:47:15<2:00:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5864/10070 [2:47:16<1:59:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5864/10070 [2:47:16<1:59:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5865/10070 [2:47:18<1:59:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5865/10070 [2:47:18<1:59:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5866/10070 [2:47:19<1:59:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5866/10070 [2:47:19<1:59:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5867/10070 [2:47:21<1:59:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5867/10070 [2:47:21<1:59:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5868/10070 [2:47:23<1:59:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5868/10070 [2:47:23<1:59:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5869/10070 [2:47:24<1:59:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5869/10070 [2:47:24<1:59:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5870/10070 [2:47:26<1:59:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5870/10070 [2:47:26<1:59:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5871/10070 [2:47:26<1:59:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5871/10070 [2:47:26<1:59:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5872/10070 [2:47:28<1:59:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5872/10070 [2:47:28<1:59:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5873/10070 [2:47:29<1:59:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5873/10070 [2:47:29<1:59:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5874/10070 [2:47:30<1:59:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5874/10070 [2:47:30<1:59:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5875/10070 [2:47:31<1:59:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5875/10070 [2:47:31<1:59:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5876/10070 [2:47:33<1:59:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5876/10070 [2:47:33<1:59:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5877/10070 [2:47:33<1:59:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5877/10070 [2:47:33<1:59:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5878/10070 [2:47:34<1:59:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5878/10070 [2:47:34<1:59:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5879/10070 [2:47:35<1:59:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5879/10070 [2:47:35<1:59:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5880/10070 [2:47:37<1:59:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5880/10070 [2:47:37<1:59:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5881/10070 [2:47:38<1:59:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5881/10070 [2:47:38<1:59:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5882/10070 [2:47:39<1:59:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5882/10070 [2:47:39<1:59:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5883/10070 [2:47:41<1:59:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5883/10070 [2:47:41<1:59:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5884/10070 [2:47:41<1:59:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5884/10070 [2:47:41<1:59:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5885/10070 [2:47:43<1:59:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5885/10070 [2:47:43<1:59:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5886/10070 [2:47:45<1:59:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5886/10070 [2:47:45<1:59:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5887/10070 [2:47:46<1:59:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5887/10070 [2:47:46<1:59:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5888/10070 [2:48:06<1:59:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5888/10070 [2:48:06<1:59:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5889/10070 [2:48:06<1:59:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5889/10070 [2:48:06<1:59:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  58%|▌| 5890/10070 [2:48:08<1:59:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  58%|▌| 5890/10070 [2:48:08<1:59:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5891/10070 [2:48:09<1:59:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5891/10070 [2:48:09<1:59:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5892/10070 [2:48:10<1:59:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5892/10070 [2:48:10<1:59:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5893/10070 [2:48:12<1:59:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5893/10070 [2:48:12<1:59:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5894/10070 [2:48:13<1:59:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5894/10070 [2:48:13<1:59:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5895/10070 [2:48:13<1:59:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5895/10070 [2:48:13<1:59:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5896/10070 [2:48:15<1:59:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5896/10070 [2:48:15<1:59:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5897/10070 [2:48:16<1:59:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5897/10070 [2:48:16<1:59:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5898/10070 [2:48:19<1:59:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5898/10070 [2:48:19<1:59:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5899/10070 [2:48:19<1:59:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5899/10070 [2:48:19<1:59:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5900/10070 [2:48:21<1:58:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5900/10070 [2:48:21<1:58:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5901/10070 [2:48:23<1:58:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5901/10070 [2:48:23<1:58:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5902/10070 [2:48:24<1:58:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5902/10070 [2:48:24<1:58:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5903/10070 [2:48:27<1:58:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5903/10070 [2:48:27<1:58:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5904/10070 [2:48:29<1:58:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5904/10070 [2:48:29<1:58:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5905/10070 [2:48:31<1:58:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5905/10070 [2:48:31<1:58:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5906/10070 [2:48:33<1:58:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5906/10070 [2:48:33<1:58:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5907/10070 [2:48:33<1:58:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5907/10070 [2:48:33<1:58:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5908/10070 [2:48:34<1:58:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5908/10070 [2:48:34<1:58:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5909/10070 [2:48:37<1:58:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5909/10070 [2:48:37<1:58:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5910/10070 [2:48:39<1:58:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5910/10070 [2:48:39<1:58:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5911/10070 [2:48:40<1:58:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5911/10070 [2:48:40<1:58:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5912/10070 [2:48:40<1:58:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5912/10070 [2:48:40<1:58:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5913/10070 [2:48:42<1:58:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5913/10070 [2:48:42<1:58:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5914/10070 [2:48:44<1:58:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5914/10070 [2:48:44<1:58:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5915/10070 [2:48:46<1:58:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5915/10070 [2:48:46<1:58:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5916/10070 [2:48:47<1:58:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5916/10070 [2:48:47<1:58:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5917/10070 [2:48:48<1:58:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5917/10070 [2:48:48<1:58:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5918/10070 [2:48:50<1:58:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5918/10070 [2:48:50<1:58:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5919/10070 [2:48:52<1:58:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5919/10070 [2:48:52<1:58:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5920/10070 [2:49:00<1:58:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5920/10070 [2:49:00<1:58:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5921/10070 [2:49:01<1:58:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5921/10070 [2:49:01<1:58:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5922/10070 [2:49:02<1:58:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5922/10070 [2:49:02<1:58:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5923/10070 [2:49:04<1:58:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5923/10070 [2:49:04<1:58:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5924/10070 [2:49:04<1:58:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5924/10070 [2:49:04<1:58:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5925/10070 [2:49:05<1:58:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5925/10070 [2:49:05<1:58:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5926/10070 [2:49:06<1:58:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5926/10070 [2:49:06<1:58:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5927/10070 [2:49:07<1:58:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5927/10070 [2:49:07<1:58:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5928/10070 [2:49:08<1:58:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5928/10070 [2:49:08<1:58:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5929/10070 [2:49:08<1:58:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5929/10070 [2:49:08<1:58:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5930/10070 [2:49:09<1:58:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5930/10070 [2:49:09<1:58:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5931/10070 [2:49:10<1:58:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5931/10070 [2:49:10<1:58:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5932/10070 [2:49:11<1:58:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5932/10070 [2:49:11<1:58:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5933/10070 [2:49:13<1:57:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5933/10070 [2:49:13<1:57:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5934/10070 [2:49:14<1:57:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5934/10070 [2:49:14<1:57:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5935/10070 [2:49:14<1:57:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5935/10070 [2:49:14<1:57:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5936/10070 [2:49:15<1:57:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5936/10070 [2:49:15<1:57:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5937/10070 [2:49:17<1:57:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5937/10070 [2:49:17<1:57:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5938/10070 [2:49:18<1:57:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5938/10070 [2:49:18<1:57:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5939/10070 [2:49:20<1:57:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5939/10070 [2:49:20<1:57:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5940/10070 [2:49:22<1:57:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5940/10070 [2:49:22<1:57:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5941/10070 [2:49:23<1:57:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5941/10070 [2:49:23<1:57:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5942/10070 [2:49:25<1:57:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5942/10070 [2:49:25<1:57:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5943/10070 [2:49:25<1:57:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5943/10070 [2:49:25<1:57:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5944/10070 [2:49:26<1:57:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5944/10070 [2:49:26<1:57:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5945/10070 [2:49:27<1:57:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5945/10070 [2:49:27<1:57:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5946/10070 [2:49:27<1:57:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5946/10070 [2:49:27<1:57:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5947/10070 [2:49:28<1:57:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5947/10070 [2:49:28<1:57:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5948/10070 [2:49:30<1:57:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5948/10070 [2:49:30<1:57:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5949/10070 [2:49:32<1:57:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5949/10070 [2:49:32<1:57:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5950/10070 [2:49:33<1:57:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5950/10070 [2:49:33<1:57:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5951/10070 [2:49:34<1:57:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5951/10070 [2:49:34<1:57:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5952/10070 [2:49:51<1:57:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5952/10070 [2:49:51<1:57:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5953/10070 [2:49:52<1:57:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5953/10070 [2:49:52<1:57:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5954/10070 [2:49:53<1:57:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5954/10070 [2:49:53<1:57:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5955/10070 [2:49:54<1:57:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5955/10070 [2:49:54<1:57:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5956/10070 [2:49:56<1:57:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5956/10070 [2:49:56<1:57:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5957/10070 [2:49:58<1:57:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5957/10070 [2:49:58<1:57:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5958/10070 [2:50:00<1:57:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5958/10070 [2:50:00<1:57:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5959/10070 [2:50:02<1:57:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5959/10070 [2:50:02<1:57:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5960/10070 [2:50:02<1:57:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5960/10070 [2:50:02<1:57:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5961/10070 [2:50:05<1:57:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5961/10070 [2:50:05<1:57:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5962/10070 [2:50:06<1:57:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5962/10070 [2:50:06<1:57:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5963/10070 [2:50:07<1:57:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5963/10070 [2:50:07<1:57:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5964/10070 [2:50:08<1:57:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5964/10070 [2:50:08<1:57:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5965/10070 [2:50:09<1:57:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5965/10070 [2:50:09<1:57:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5966/10070 [2:50:10<1:57:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5966/10070 [2:50:10<1:57:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5967/10070 [2:50:12<1:57:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5967/10070 [2:50:12<1:57:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5968/10070 [2:50:14<1:57:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5968/10070 [2:50:14<1:57:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5969/10070 [2:50:16<1:56:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5969/10070 [2:50:16<1:56:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5970/10070 [2:50:17<1:56:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5970/10070 [2:50:17<1:56:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5971/10070 [2:50:18<1:56:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5971/10070 [2:50:18<1:56:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5972/10070 [2:50:19<1:56:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5972/10070 [2:50:19<1:56:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5973/10070 [2:50:21<1:56:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5973/10070 [2:50:21<1:56:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5974/10070 [2:50:22<1:56:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5974/10070 [2:50:22<1:56:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5975/10070 [2:50:23<1:56:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5975/10070 [2:50:23<1:56:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5976/10070 [2:50:24<1:56:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5976/10070 [2:50:24<1:56:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5977/10070 [2:50:27<1:56:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5977/10070 [2:50:27<1:56:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5978/10070 [2:50:27<1:56:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5978/10070 [2:50:27<1:56:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5979/10070 [2:50:29<1:56:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5979/10070 [2:50:29<1:56:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5980/10070 [2:50:31<1:56:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5980/10070 [2:50:31<1:56:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5981/10070 [2:50:33<1:56:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5981/10070 [2:50:33<1:56:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5982/10070 [2:50:34<1:56:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5982/10070 [2:50:34<1:56:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5983/10070 [2:50:36<1:56:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5983/10070 [2:50:36<1:56:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5984/10070 [2:50:43<1:56:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5984/10070 [2:50:43<1:56:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5985/10070 [2:50:45<1:56:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5985/10070 [2:50:45<1:56:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5986/10070 [2:50:46<1:56:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5986/10070 [2:50:46<1:56:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5987/10070 [2:50:49<1:56:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5987/10070 [2:50:49<1:56:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5988/10070 [2:50:49<1:56:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5988/10070 [2:50:49<1:56:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5989/10070 [2:50:51<1:56:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5989/10070 [2:50:51<1:56:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5990/10070 [2:50:53<1:56:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5990/10070 [2:50:53<1:56:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  59%|▌| 5991/10070 [2:50:53<1:56:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  59%|▌| 5991/10070 [2:50:53<1:56:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 5992/10070 [2:50:55<1:56:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 5992/10070 [2:50:55<1:56:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 5993/10070 [2:50:56<1:56:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 5993/10070 [2:50:56<1:56:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 5994/10070 [2:50:59<1:56:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 5994/10070 [2:50:59<1:56:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 5995/10070 [2:51:00<1:56:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 5995/10070 [2:51:00<1:56:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 5996/10070 [2:51:00<1:56:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 5996/10070 [2:51:00<1:56:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 5997/10070 [2:51:02<1:56:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 5997/10070 [2:51:02<1:56:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 5998/10070 [2:51:04<1:56:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 5998/10070 [2:51:04<1:56:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 5999/10070 [2:51:05<1:56:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 5999/10070 [2:51:05<1:56:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6000/10070 [2:51:06<1:56:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6000/10070 [2:51:06<1:56:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6001/10070 [2:51:07<1:56:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6001/10070 [2:51:07<1:56:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6002/10070 [2:51:08<1:55:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6002/10070 [2:51:08<1:55:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6003/10070 [2:51:11<1:55:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6003/10070 [2:51:11<1:55:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6004/10070 [2:51:13<1:55:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6004/10070 [2:51:13<1:55:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6005/10070 [2:51:14<1:55:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6005/10070 [2:51:14<1:55:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6006/10070 [2:51:16<1:55:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6006/10070 [2:51:16<1:55:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6007/10070 [2:51:17<1:55:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6007/10070 [2:51:17<1:55:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6008/10070 [2:51:18<1:55:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6008/10070 [2:51:18<1:55:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6009/10070 [2:51:18<1:55:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6009/10070 [2:51:18<1:55:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6010/10070 [2:51:19<1:55:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6010/10070 [2:51:19<1:55:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6011/10070 [2:51:21<1:55:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6011/10070 [2:51:21<1:55:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6012/10070 [2:51:23<1:55:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6012/10070 [2:51:23<1:55:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6013/10070 [2:51:23<1:55:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6013/10070 [2:51:23<1:55:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6014/10070 [2:51:26<1:55:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6014/10070 [2:51:26<1:55:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6015/10070 [2:51:27<1:55:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6015/10070 [2:51:27<1:55:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6016/10070 [2:51:36<1:55:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6016/10070 [2:51:36<1:55:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6017/10070 [2:51:37<1:55:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6017/10070 [2:51:37<1:55:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6018/10070 [2:51:38<1:55:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6018/10070 [2:51:38<1:55:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6019/10070 [2:51:40<1:55:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6019/10070 [2:51:40<1:55:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6020/10070 [2:51:41<1:55:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6020/10070 [2:51:41<1:55:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6021/10070 [2:51:43<1:55:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6021/10070 [2:51:43<1:55:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6022/10070 [2:51:43<1:55:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6022/10070 [2:51:43<1:55:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6023/10070 [2:51:45<1:55:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6023/10070 [2:51:45<1:55:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6024/10070 [2:51:46<1:55:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6024/10070 [2:51:46<1:55:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6025/10070 [2:51:47<1:55:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6025/10070 [2:51:47<1:55:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6026/10070 [2:51:48<1:55:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6026/10070 [2:51:48<1:55:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6027/10070 [2:51:49<1:55:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6027/10070 [2:51:49<1:55:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6028/10070 [2:51:50<1:55:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6028/10070 [2:51:50<1:55:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6029/10070 [2:51:51<1:55:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6029/10070 [2:51:51<1:55:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6030/10070 [2:51:53<1:55:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6030/10070 [2:51:53<1:55:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6031/10070 [2:51:54<1:55:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6031/10070 [2:51:54<1:55:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6032/10070 [2:51:55<1:55:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6032/10070 [2:51:55<1:55:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6033/10070 [2:51:57<1:55:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6033/10070 [2:51:57<1:55:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6034/10070 [2:51:58<1:55:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6034/10070 [2:51:58<1:55:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6035/10070 [2:51:59<1:54:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6035/10070 [2:51:59<1:54:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6036/10070 [2:52:00<1:54:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6036/10070 [2:52:00<1:54:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6037/10070 [2:52:01<1:54:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6037/10070 [2:52:01<1:54:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6038/10070 [2:52:03<1:54:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6038/10070 [2:52:03<1:54:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6039/10070 [2:52:03<1:54:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6039/10070 [2:52:03<1:54:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6040/10070 [2:52:04<1:54:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6040/10070 [2:52:04<1:54:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6041/10070 [2:52:06<1:54:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6041/10070 [2:52:06<1:54:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6042/10070 [2:52:07<1:54:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6042/10070 [2:52:07<1:54:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6043/10070 [2:52:09<1:54:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6043/10070 [2:52:09<1:54:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6044/10070 [2:52:10<1:54:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6044/10070 [2:52:10<1:54:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6045/10070 [2:52:10<1:54:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6045/10070 [2:52:10<1:54:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6046/10070 [2:52:12<1:54:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6046/10070 [2:52:12<1:54:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6047/10070 [2:52:14<1:54:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6047/10070 [2:52:14<1:54:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6048/10070 [2:52:34<1:54:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6048/10070 [2:52:34<1:54:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6049/10070 [2:52:36<1:54:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6049/10070 [2:52:36<1:54:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6050/10070 [2:52:38<1:54:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6050/10070 [2:52:38<1:54:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6051/10070 [2:52:40<1:54:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6051/10070 [2:52:40<1:54:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6052/10070 [2:52:41<1:54:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6052/10070 [2:52:41<1:54:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6053/10070 [2:52:43<1:54:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6053/10070 [2:52:43<1:54:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6054/10070 [2:52:43<1:54:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6054/10070 [2:52:43<1:54:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6055/10070 [2:52:45<1:54:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6055/10070 [2:52:45<1:54:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6056/10070 [2:52:48<1:54:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6056/10070 [2:52:48<1:54:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6057/10070 [2:52:49<1:54:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6057/10070 [2:52:49<1:54:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6058/10070 [2:52:51<1:54:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6058/10070 [2:52:51<1:54:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6059/10070 [2:52:53<1:54:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6059/10070 [2:52:53<1:54:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6060/10070 [2:52:55<1:54:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6060/10070 [2:52:55<1:54:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6061/10070 [2:52:57<1:54:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6061/10070 [2:52:57<1:54:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6062/10070 [2:52:58<1:54:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6062/10070 [2:52:58<1:54:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6063/10070 [2:52:59<1:54:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6063/10070 [2:52:59<1:54:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6064/10070 [2:53:00<1:54:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6064/10070 [2:53:00<1:54:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6065/10070 [2:53:00<1:54:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6065/10070 [2:53:00<1:54:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6066/10070 [2:53:02<1:54:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6066/10070 [2:53:02<1:54:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6067/10070 [2:53:04<1:54:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6067/10070 [2:53:04<1:54:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6068/10070 [2:53:06<1:54:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6068/10070 [2:53:06<1:54:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6069/10070 [2:53:07<1:54:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6069/10070 [2:53:07<1:54:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6070/10070 [2:53:07<1:54:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6070/10070 [2:53:07<1:54:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6071/10070 [2:53:09<1:54:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6071/10070 [2:53:09<1:54:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6072/10070 [2:53:10<1:54:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6072/10070 [2:53:10<1:54:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6073/10070 [2:53:11<1:53:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6073/10070 [2:53:11<1:53:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6074/10070 [2:53:12<1:53:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6074/10070 [2:53:12<1:53:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6075/10070 [2:53:13<1:53:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6075/10070 [2:53:13<1:53:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6076/10070 [2:53:15<1:53:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6076/10070 [2:53:15<1:53:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6077/10070 [2:53:16<1:53:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6077/10070 [2:53:16<1:53:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6078/10070 [2:53:16<1:53:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6078/10070 [2:53:16<1:53:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6079/10070 [2:53:18<1:53:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6079/10070 [2:53:18<1:53:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6080/10070 [2:53:28<1:53:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6080/10070 [2:53:28<1:53:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6081/10070 [2:53:30<1:53:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6081/10070 [2:53:30<1:53:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6082/10070 [2:53:31<1:53:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6082/10070 [2:53:31<1:53:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6083/10070 [2:53:32<1:53:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6083/10070 [2:53:32<1:53:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6084/10070 [2:53:34<1:53:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6084/10070 [2:53:34<1:53:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6085/10070 [2:53:36<1:53:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6085/10070 [2:53:36<1:53:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6086/10070 [2:53:38<1:53:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6086/10070 [2:53:38<1:53:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6087/10070 [2:53:38<1:53:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6087/10070 [2:53:38<1:53:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6088/10070 [2:53:39<1:53:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6088/10070 [2:53:39<1:53:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6089/10070 [2:53:40<1:53:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6089/10070 [2:53:40<1:53:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6090/10070 [2:53:40<1:53:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6090/10070 [2:53:40<1:53:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6091/10070 [2:53:43<1:53:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6091/10070 [2:53:43<1:53:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  60%|▌| 6092/10070 [2:53:44<1:53:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  60%|▌| 6092/10070 [2:53:44<1:53:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6093/10070 [2:53:44<1:53:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6093/10070 [2:53:44<1:53:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6094/10070 [2:53:46<1:53:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6094/10070 [2:53:46<1:53:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6095/10070 [2:53:47<1:53:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6095/10070 [2:53:47<1:53:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6096/10070 [2:53:48<1:53:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6096/10070 [2:53:48<1:53:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6097/10070 [2:53:50<1:53:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6097/10070 [2:53:50<1:53:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6098/10070 [2:53:51<1:53:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6098/10070 [2:53:51<1:53:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6099/10070 [2:53:53<1:53:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6099/10070 [2:53:53<1:53:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6100/10070 [2:53:54<1:53:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6100/10070 [2:53:54<1:53:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6101/10070 [2:53:55<1:53:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6101/10070 [2:53:55<1:53:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6102/10070 [2:53:57<1:53:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6102/10070 [2:53:57<1:53:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6103/10070 [2:53:59<1:53:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6103/10070 [2:53:59<1:53:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6104/10070 [2:53:59<1:53:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6104/10070 [2:53:59<1:53:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6105/10070 [2:54:00<1:53:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6105/10070 [2:54:00<1:53:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6106/10070 [2:54:01<1:52:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6106/10070 [2:54:01<1:52:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6107/10070 [2:54:02<1:52:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6107/10070 [2:54:02<1:52:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6108/10070 [2:54:04<1:52:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6108/10070 [2:54:04<1:52:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6109/10070 [2:54:06<1:52:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6109/10070 [2:54:06<1:52:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6110/10070 [2:54:06<1:52:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6110/10070 [2:54:06<1:52:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6111/10070 [2:54:07<1:52:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6111/10070 [2:54:07<1:52:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6112/10070 [2:54:24<1:52:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6112/10070 [2:54:24<1:52:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6113/10070 [2:54:26<1:52:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6113/10070 [2:54:26<1:52:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6114/10070 [2:54:27<1:52:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6114/10070 [2:54:27<1:52:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6115/10070 [2:54:28<1:52:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6115/10070 [2:54:28<1:52:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6116/10070 [2:54:30<1:52:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6116/10070 [2:54:30<1:52:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6117/10070 [2:54:31<1:52:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6117/10070 [2:54:31<1:52:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6118/10070 [2:54:34<1:52:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6118/10070 [2:54:34<1:52:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6119/10070 [2:54:35<1:52:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6119/10070 [2:54:35<1:52:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6120/10070 [2:54:37<1:52:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6120/10070 [2:54:37<1:52:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6121/10070 [2:54:38<1:52:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6121/10070 [2:54:38<1:52:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6122/10070 [2:54:40<1:52:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6122/10070 [2:54:40<1:52:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6123/10070 [2:54:43<1:52:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6123/10070 [2:54:43<1:52:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6124/10070 [2:54:44<1:52:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6124/10070 [2:54:44<1:52:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6125/10070 [2:54:46<1:52:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6125/10070 [2:54:46<1:52:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6126/10070 [2:54:48<1:52:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6126/10070 [2:54:48<1:52:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6127/10070 [2:54:49<1:52:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6127/10070 [2:54:49<1:52:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6128/10070 [2:54:51<1:52:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6128/10070 [2:54:51<1:52:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6129/10070 [2:54:52<1:52:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6129/10070 [2:54:52<1:52:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6130/10070 [2:54:54<1:52:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6130/10070 [2:54:54<1:52:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6131/10070 [2:54:56<1:52:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6131/10070 [2:54:56<1:52:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6132/10070 [2:54:58<1:52:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6132/10070 [2:54:58<1:52:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6133/10070 [2:55:00<1:52:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6133/10070 [2:55:00<1:52:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6134/10070 [2:55:02<1:52:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6134/10070 [2:55:02<1:52:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6135/10070 [2:55:03<1:52:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6135/10070 [2:55:03<1:52:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6136/10070 [2:55:05<1:52:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6136/10070 [2:55:05<1:52:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6137/10070 [2:55:06<1:52:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6137/10070 [2:55:06<1:52:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6138/10070 [2:55:08<1:52:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6138/10070 [2:55:08<1:52:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6139/10070 [2:55:09<1:52:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6139/10070 [2:55:09<1:52:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6140/10070 [2:55:12<1:52:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6140/10070 [2:55:12<1:52:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6141/10070 [2:55:13<1:52:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6141/10070 [2:55:13<1:52:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6142/10070 [2:55:14<1:52:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6142/10070 [2:55:14<1:52:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6143/10070 [2:55:15<1:52:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6143/10070 [2:55:15<1:52:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6144/10070 [2:55:23<1:52:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6144/10070 [2:55:23<1:52:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6145/10070 [2:55:24<1:52:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6145/10070 [2:55:24<1:52:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6146/10070 [2:55:25<1:52:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6146/10070 [2:55:25<1:52:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6147/10070 [2:55:26<1:51:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6147/10070 [2:55:26<1:51:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6148/10070 [2:55:27<1:51:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6148/10070 [2:55:27<1:51:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6149/10070 [2:55:28<1:51:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6149/10070 [2:55:28<1:51:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6150/10070 [2:55:31<1:51:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6150/10070 [2:55:31<1:51:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6151/10070 [2:55:31<1:51:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6151/10070 [2:55:31<1:51:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6152/10070 [2:55:32<1:51:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6152/10070 [2:55:32<1:51:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6153/10070 [2:55:34<1:51:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6153/10070 [2:55:34<1:51:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6154/10070 [2:55:36<1:51:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6154/10070 [2:55:36<1:51:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6155/10070 [2:55:38<1:51:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6155/10070 [2:55:38<1:51:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6156/10070 [2:55:40<1:51:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6156/10070 [2:55:40<1:51:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6157/10070 [2:55:43<1:51:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6157/10070 [2:55:43<1:51:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6158/10070 [2:55:44<1:51:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6158/10070 [2:55:44<1:51:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6159/10070 [2:55:45<1:51:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6159/10070 [2:55:45<1:51:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6160/10070 [2:55:48<1:51:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6160/10070 [2:55:48<1:51:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6161/10070 [2:55:49<1:51:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6161/10070 [2:55:49<1:51:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6162/10070 [2:55:50<1:51:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6162/10070 [2:55:50<1:51:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6163/10070 [2:55:51<1:51:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6163/10070 [2:55:51<1:51:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6164/10070 [2:55:51<1:51:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6164/10070 [2:55:51<1:51:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6165/10070 [2:55:53<1:51:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6165/10070 [2:55:53<1:51:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6166/10070 [2:55:55<1:51:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6166/10070 [2:55:55<1:51:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6167/10070 [2:55:57<1:51:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6167/10070 [2:55:57<1:51:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6168/10070 [2:55:58<1:51:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6168/10070 [2:55:58<1:51:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6169/10070 [2:55:59<1:51:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6169/10070 [2:55:59<1:51:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6170/10070 [2:56:00<1:51:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6170/10070 [2:56:00<1:51:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6171/10070 [2:56:02<1:51:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6171/10070 [2:56:02<1:51:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6172/10070 [2:56:03<1:51:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6172/10070 [2:56:03<1:51:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6173/10070 [2:56:05<1:51:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6173/10070 [2:56:05<1:51:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6174/10070 [2:56:06<1:51:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6174/10070 [2:56:06<1:51:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6175/10070 [2:56:06<1:51:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6175/10070 [2:56:06<1:51:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6176/10070 [2:56:18<1:51:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6176/10070 [2:56:18<1:51:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6177/10070 [2:56:19<1:51:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6177/10070 [2:56:19<1:51:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6178/10070 [2:56:22<1:51:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6178/10070 [2:56:22<1:51:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6179/10070 [2:56:23<1:51:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6179/10070 [2:56:23<1:51:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6180/10070 [2:56:24<1:51:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6180/10070 [2:56:24<1:51:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6181/10070 [2:56:26<1:51:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6181/10070 [2:56:26<1:51:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6182/10070 [2:56:26<1:50:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6182/10070 [2:56:26<1:50:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6183/10070 [2:56:27<1:50:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6183/10070 [2:56:27<1:50:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6184/10070 [2:56:28<1:50:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6184/10070 [2:56:28<1:50:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6185/10070 [2:56:30<1:50:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6185/10070 [2:56:30<1:50:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6186/10070 [2:56:32<1:50:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6186/10070 [2:56:32<1:50:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6187/10070 [2:56:34<1:50:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6187/10070 [2:56:34<1:50:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6188/10070 [2:56:35<1:50:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6188/10070 [2:56:35<1:50:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6189/10070 [2:56:37<1:50:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6189/10070 [2:56:37<1:50:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6190/10070 [2:56:38<1:50:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6190/10070 [2:56:38<1:50:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6191/10070 [2:56:39<1:50:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6191/10070 [2:56:39<1:50:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6192/10070 [2:56:42<1:50:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6192/10070 [2:56:42<1:50:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  61%|▌| 6193/10070 [2:56:43<1:50:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  61%|▌| 6193/10070 [2:56:43<1:50:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6194/10070 [2:56:44<1:50:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6194/10070 [2:56:44<1:50:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6195/10070 [2:56:44<1:50:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6195/10070 [2:56:44<1:50:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6196/10070 [2:56:46<1:50:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6196/10070 [2:56:46<1:50:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6197/10070 [2:56:48<1:50:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6197/10070 [2:56:48<1:50:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6198/10070 [2:56:50<1:50:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6198/10070 [2:56:50<1:50:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6199/10070 [2:56:51<1:50:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6199/10070 [2:56:51<1:50:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6200/10070 [2:56:53<1:50:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6200/10070 [2:56:53<1:50:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6201/10070 [2:56:54<1:50:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6201/10070 [2:56:54<1:50:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6202/10070 [2:56:56<1:50:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6202/10070 [2:56:56<1:50:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6203/10070 [2:56:57<1:50:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6203/10070 [2:56:57<1:50:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6204/10070 [2:56:58<1:50:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6204/10070 [2:56:58<1:50:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6205/10070 [2:56:59<1:50:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6205/10070 [2:56:59<1:50:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6206/10070 [2:57:00<1:50:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6206/10070 [2:57:00<1:50:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6207/10070 [2:57:01<1:50:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6207/10070 [2:57:01<1:50:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6208/10070 [2:57:09<1:50:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6208/10070 [2:57:09<1:50:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6209/10070 [2:57:11<1:50:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6209/10070 [2:57:11<1:50:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6210/10070 [2:57:13<1:50:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6210/10070 [2:57:13<1:50:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6211/10070 [2:57:14<1:50:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6211/10070 [2:57:14<1:50:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6212/10070 [2:57:14<1:50:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6212/10070 [2:57:14<1:50:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6213/10070 [2:57:15<1:50:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6213/10070 [2:57:15<1:50:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6214/10070 [2:57:16<1:50:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6214/10070 [2:57:16<1:50:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6215/10070 [2:57:18<1:49:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6215/10070 [2:57:18<1:49:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6216/10070 [2:57:18<1:49:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6216/10070 [2:57:18<1:49:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6217/10070 [2:57:19<1:49:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6217/10070 [2:57:19<1:49:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6218/10070 [2:57:21<1:49:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6218/10070 [2:57:21<1:49:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6219/10070 [2:57:22<1:49:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6219/10070 [2:57:22<1:49:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6220/10070 [2:57:24<1:49:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6220/10070 [2:57:24<1:49:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6221/10070 [2:57:26<1:49:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6221/10070 [2:57:26<1:49:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6222/10070 [2:57:27<1:49:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6222/10070 [2:57:27<1:49:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6223/10070 [2:57:28<1:49:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6223/10070 [2:57:28<1:49:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6224/10070 [2:57:29<1:49:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6224/10070 [2:57:29<1:49:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6225/10070 [2:57:30<1:49:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6225/10070 [2:57:30<1:49:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6226/10070 [2:57:31<1:49:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6226/10070 [2:57:31<1:49:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6227/10070 [2:57:33<1:49:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6227/10070 [2:57:33<1:49:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6228/10070 [2:57:36<1:49:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6228/10070 [2:57:36<1:49:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6229/10070 [2:57:36<1:49:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6229/10070 [2:57:36<1:49:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6230/10070 [2:57:38<1:49:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6230/10070 [2:57:38<1:49:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6231/10070 [2:57:39<1:49:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6231/10070 [2:57:39<1:49:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6232/10070 [2:57:41<1:49:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6232/10070 [2:57:41<1:49:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6233/10070 [2:57:43<1:49:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6233/10070 [2:57:43<1:49:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6234/10070 [2:57:45<1:49:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6234/10070 [2:57:45<1:49:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6235/10070 [2:57:46<1:49:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6235/10070 [2:57:46<1:49:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6236/10070 [2:57:47<1:49:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6236/10070 [2:57:47<1:49:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6237/10070 [2:57:48<1:49:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6237/10070 [2:57:48<1:49:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6238/10070 [2:57:49<1:49:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6238/10070 [2:57:49<1:49:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6239/10070 [2:57:50<1:49:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6239/10070 [2:57:50<1:49:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6240/10070 [2:58:02<1:49:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6240/10070 [2:58:02<1:49:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6241/10070 [2:58:05<1:49:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6241/10070 [2:58:05<1:49:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6242/10070 [2:58:07<1:49:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6242/10070 [2:58:07<1:49:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6243/10070 [2:58:08<1:49:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6243/10070 [2:58:08<1:49:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6244/10070 [2:58:09<1:49:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6244/10070 [2:58:09<1:49:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6245/10070 [2:58:10<1:49:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6245/10070 [2:58:10<1:49:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6246/10070 [2:58:11<1:49:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6246/10070 [2:58:11<1:49:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6247/10070 [2:58:12<1:49:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6247/10070 [2:58:12<1:49:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6248/10070 [2:58:14<1:49:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6248/10070 [2:58:14<1:49:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6249/10070 [2:58:14<1:48:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6249/10070 [2:58:14<1:48:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6250/10070 [2:58:16<1:48:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6250/10070 [2:58:16<1:48:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6251/10070 [2:58:16<1:48:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6251/10070 [2:58:16<1:48:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6252/10070 [2:58:18<1:48:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6252/10070 [2:58:18<1:48:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6253/10070 [2:58:20<1:48:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6253/10070 [2:58:20<1:48:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6254/10070 [2:58:21<1:48:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6254/10070 [2:58:21<1:48:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6255/10070 [2:58:23<1:48:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6255/10070 [2:58:23<1:48:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6256/10070 [2:58:25<1:48:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6256/10070 [2:58:25<1:48:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6257/10070 [2:58:27<1:48:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6257/10070 [2:58:27<1:48:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6258/10070 [2:58:29<1:48:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6258/10070 [2:58:29<1:48:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6259/10070 [2:58:31<1:48:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6259/10070 [2:58:31<1:48:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6260/10070 [2:58:33<1:48:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6260/10070 [2:58:33<1:48:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6261/10070 [2:58:34<1:48:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6261/10070 [2:58:34<1:48:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6262/10070 [2:58:35<1:48:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6262/10070 [2:58:35<1:48:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6263/10070 [2:58:37<1:48:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6263/10070 [2:58:37<1:48:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6264/10070 [2:58:38<1:48:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6264/10070 [2:58:38<1:48:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6265/10070 [2:58:40<1:48:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6265/10070 [2:58:40<1:48:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6266/10070 [2:58:41<1:48:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6266/10070 [2:58:41<1:48:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6267/10070 [2:58:43<1:48:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6267/10070 [2:58:43<1:48:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6268/10070 [2:58:44<1:48:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6268/10070 [2:58:44<1:48:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6269/10070 [2:58:45<1:48:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6269/10070 [2:58:45<1:48:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6270/10070 [2:58:46<1:48:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6270/10070 [2:58:46<1:48:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6271/10070 [2:58:48<1:48:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6271/10070 [2:58:48<1:48:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6272/10070 [2:58:59<1:48:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6272/10070 [2:58:59<1:48:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6273/10070 [2:59:01<1:48:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6273/10070 [2:59:01<1:48:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6274/10070 [2:59:03<1:48:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6274/10070 [2:59:03<1:48:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6275/10070 [2:59:05<1:48:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6275/10070 [2:59:05<1:48:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6276/10070 [2:59:06<1:48:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6276/10070 [2:59:06<1:48:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6277/10070 [2:59:06<1:48:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6277/10070 [2:59:06<1:48:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6278/10070 [2:59:08<1:48:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6278/10070 [2:59:08<1:48:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6279/10070 [2:59:09<1:48:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6279/10070 [2:59:09<1:48:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6280/10070 [2:59:10<1:48:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6280/10070 [2:59:10<1:48:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6281/10070 [2:59:13<1:48:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6281/10070 [2:59:13<1:48:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6282/10070 [2:59:13<1:48:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6282/10070 [2:59:13<1:48:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6283/10070 [2:59:15<1:48:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6283/10070 [2:59:15<1:48:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6284/10070 [2:59:17<1:48:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6284/10070 [2:59:17<1:48:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6285/10070 [2:59:18<1:47:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6285/10070 [2:59:18<1:47:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6286/10070 [2:59:19<1:47:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6286/10070 [2:59:19<1:47:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6287/10070 [2:59:20<1:47:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6287/10070 [2:59:20<1:47:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6288/10070 [2:59:21<1:47:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6288/10070 [2:59:21<1:47:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6289/10070 [2:59:22<1:47:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6289/10070 [2:59:22<1:47:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6290/10070 [2:59:23<1:47:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6290/10070 [2:59:23<1:47:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6291/10070 [2:59:26<1:47:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6291/10070 [2:59:26<1:47:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6292/10070 [2:59:26<1:47:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6292/10070 [2:59:26<1:47:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  62%|▌| 6293/10070 [2:59:28<1:47:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  62%|▌| 6293/10070 [2:59:28<1:47:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6294/10070 [2:59:30<1:47:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6294/10070 [2:59:30<1:47:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6295/10070 [2:59:30<1:47:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6295/10070 [2:59:30<1:47:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6296/10070 [2:59:32<1:47:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6296/10070 [2:59:32<1:47:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6297/10070 [2:59:34<1:47:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6297/10070 [2:59:34<1:47:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6298/10070 [2:59:35<1:47:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6298/10070 [2:59:35<1:47:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6299/10070 [2:59:37<1:47:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6299/10070 [2:59:37<1:47:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6300/10070 [2:59:39<1:47:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6300/10070 [2:59:39<1:47:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6301/10070 [2:59:41<1:47:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6301/10070 [2:59:41<1:47:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6302/10070 [2:59:43<1:47:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6302/10070 [2:59:43<1:47:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6303/10070 [2:59:44<1:47:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6303/10070 [2:59:44<1:47:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6304/10070 [2:59:52<1:47:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6304/10070 [2:59:52<1:47:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6305/10070 [2:59:53<1:47:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6305/10070 [2:59:53<1:47:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6306/10070 [2:59:54<1:47:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6306/10070 [2:59:54<1:47:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6307/10070 [2:59:55<1:47:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6307/10070 [2:59:55<1:47:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6308/10070 [2:59:56<1:47:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6308/10070 [2:59:56<1:47:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6309/10070 [2:59:57<1:47:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6309/10070 [2:59:57<1:47:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6310/10070 [2:59:59<1:47:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6310/10070 [2:59:59<1:47:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6311/10070 [3:00:01<1:47:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6311/10070 [3:00:01<1:47:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6312/10070 [3:00:02<1:47:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6312/10070 [3:00:02<1:47:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6313/10070 [3:00:03<1:47:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6313/10070 [3:00:03<1:47:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6314/10070 [3:00:04<1:47:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6314/10070 [3:00:04<1:47:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6315/10070 [3:00:07<1:47:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6315/10070 [3:00:07<1:47:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6316/10070 [3:00:08<1:47:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6316/10070 [3:00:08<1:47:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6317/10070 [3:00:09<1:47:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6317/10070 [3:00:09<1:47:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6318/10070 [3:00:11<1:47:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6318/10070 [3:00:11<1:47:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6319/10070 [3:00:12<1:46:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6319/10070 [3:00:12<1:46:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6320/10070 [3:00:13<1:46:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6320/10070 [3:00:13<1:46:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6321/10070 [3:00:13<1:46:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6321/10070 [3:00:13<1:46:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6322/10070 [3:00:15<1:46:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6322/10070 [3:00:15<1:46:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6323/10070 [3:00:16<1:46:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6323/10070 [3:00:16<1:46:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6324/10070 [3:00:17<1:46:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6324/10070 [3:00:17<1:46:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6325/10070 [3:00:20<1:46:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6325/10070 [3:00:20<1:46:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6326/10070 [3:00:21<1:46:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6326/10070 [3:00:21<1:46:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6327/10070 [3:00:23<1:46:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6327/10070 [3:00:23<1:46:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6328/10070 [3:00:23<1:46:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6328/10070 [3:00:23<1:46:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6329/10070 [3:00:24<1:46:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6329/10070 [3:00:24<1:46:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6330/10070 [3:00:26<1:46:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6330/10070 [3:00:26<1:46:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6331/10070 [3:00:27<1:46:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6331/10070 [3:00:27<1:46:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6332/10070 [3:00:27<1:46:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6332/10070 [3:00:27<1:46:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6333/10070 [3:00:30<1:46:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6333/10070 [3:00:30<1:46:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6334/10070 [3:00:31<1:46:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6334/10070 [3:00:31<1:46:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6335/10070 [3:00:31<1:46:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6335/10070 [3:00:31<1:46:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6336/10070 [3:00:45<1:46:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6336/10070 [3:00:45<1:46:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6337/10070 [3:00:46<1:46:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6337/10070 [3:00:46<1:46:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6338/10070 [3:00:47<1:46:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6338/10070 [3:00:47<1:46:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6339/10070 [3:00:48<1:46:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6339/10070 [3:00:48<1:46:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6340/10070 [3:00:49<1:46:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6340/10070 [3:00:49<1:46:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6341/10070 [3:00:50<1:46:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6341/10070 [3:00:50<1:46:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6342/10070 [3:00:50<1:46:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6342/10070 [3:00:50<1:46:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6343/10070 [3:00:51<1:46:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6343/10070 [3:00:51<1:46:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6344/10070 [3:00:53<1:46:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6344/10070 [3:00:53<1:46:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6345/10070 [3:00:55<1:46:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6345/10070 [3:00:55<1:46:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6346/10070 [3:00:55<1:46:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6346/10070 [3:00:55<1:46:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6347/10070 [3:00:56<1:46:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6347/10070 [3:00:56<1:46:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6348/10070 [3:00:57<1:46:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6348/10070 [3:00:57<1:46:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6349/10070 [3:00:59<1:46:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6349/10070 [3:00:59<1:46:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6350/10070 [3:01:00<1:46:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6350/10070 [3:01:00<1:46:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6351/10070 [3:01:02<1:46:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6351/10070 [3:01:02<1:46:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6352/10070 [3:01:03<1:45:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6352/10070 [3:01:03<1:45:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6353/10070 [3:01:04<1:45:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6353/10070 [3:01:04<1:45:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6354/10070 [3:01:05<1:45:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6354/10070 [3:01:05<1:45:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6355/10070 [3:01:07<1:45:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6355/10070 [3:01:07<1:45:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6356/10070 [3:01:08<1:45:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6356/10070 [3:01:08<1:45:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6357/10070 [3:01:08<1:45:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6357/10070 [3:01:08<1:45:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6358/10070 [3:01:11<1:45:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6358/10070 [3:01:11<1:45:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6359/10070 [3:01:12<1:45:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6359/10070 [3:01:12<1:45:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6360/10070 [3:01:13<1:45:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6360/10070 [3:01:13<1:45:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6361/10070 [3:01:15<1:45:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6361/10070 [3:01:15<1:45:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6362/10070 [3:01:17<1:45:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6362/10070 [3:01:17<1:45:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6363/10070 [3:01:17<1:45:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6363/10070 [3:01:17<1:45:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6364/10070 [3:01:18<1:45:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6364/10070 [3:01:18<1:45:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6365/10070 [3:01:19<1:45:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|���| 6365/10070 [3:01:19<1:45:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6366/10070 [3:01:21<1:45:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6366/10070 [3:01:21<1:45:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6367/10070 [3:01:22<1:45:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6367/10070 [3:01:22<1:45:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6368/10070 [3:01:39<1:45:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6368/10070 [3:01:39<1:45:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6369/10070 [3:01:41<1:45:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6369/10070 [3:01:41<1:45:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6370/10070 [3:01:42<1:45:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6370/10070 [3:01:42<1:45:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6371/10070 [3:01:42<1:45:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6371/10070 [3:01:42<1:45:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6372/10070 [3:01:43<1:45:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6372/10070 [3:01:43<1:45:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6373/10070 [3:01:45<1:45:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6373/10070 [3:01:45<1:45:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6374/10070 [3:01:46<1:45:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6374/10070 [3:01:46<1:45:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6375/10070 [3:01:48<1:45:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6375/10070 [3:01:48<1:45:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6376/10070 [3:01:48<1:45:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6376/10070 [3:01:48<1:45:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6377/10070 [3:01:49<1:45:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6377/10070 [3:01:49<1:45:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6378/10070 [3:01:51<1:45:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6378/10070 [3:01:51<1:45:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6379/10070 [3:01:52<1:45:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6379/10070 [3:01:52<1:45:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6380/10070 [3:01:54<1:45:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6380/10070 [3:01:54<1:45:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6381/10070 [3:01:55<1:45:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6381/10070 [3:01:55<1:45:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6382/10070 [3:01:56<1:45:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6382/10070 [3:01:56<1:45:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6383/10070 [3:01:58<1:45:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6383/10070 [3:01:58<1:45:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6384/10070 [3:02:00<1:45:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6384/10070 [3:02:00<1:45:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6385/10070 [3:02:02<1:45:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6385/10070 [3:02:02<1:45:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6386/10070 [3:02:03<1:45:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6386/10070 [3:02:03<1:45:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6387/10070 [3:02:04<1:44:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6387/10070 [3:02:04<1:44:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6388/10070 [3:02:05<1:44:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6388/10070 [3:02:05<1:44:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6389/10070 [3:02:06<1:44:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6389/10070 [3:02:06<1:44:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6390/10070 [3:02:08<1:44:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6390/10070 [3:02:08<1:44:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6391/10070 [3:02:11<1:44:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6391/10070 [3:02:11<1:44:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6392/10070 [3:02:13<1:44:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6392/10070 [3:02:13<1:44:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6393/10070 [3:02:15<1:44:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6393/10070 [3:02:15<1:44:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  63%|▋| 6394/10070 [3:02:17<1:44:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  63%|▋| 6394/10070 [3:02:17<1:44:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6395/10070 [3:02:18<1:44:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6395/10070 [3:02:18<1:44:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6396/10070 [3:02:19<1:44:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6396/10070 [3:02:19<1:44:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6397/10070 [3:02:21<1:44:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6397/10070 [3:02:21<1:44:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6398/10070 [3:02:22<1:44:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6398/10070 [3:02:22<1:44:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6399/10070 [3:02:23<1:44:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6399/10070 [3:02:23<1:44:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6400/10070 [3:02:33<1:44:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6400/10070 [3:02:33<1:44:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6401/10070 [3:02:55<1:44:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6401/10070 [3:02:55<1:44:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6402/10070 [3:02:55<1:44:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6402/10070 [3:02:55<1:44:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6403/10070 [3:02:57<1:44:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6403/10070 [3:02:57<1:44:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6404/10070 [3:02:58<1:44:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6404/10070 [3:02:58<1:44:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6405/10070 [3:02:59<1:44:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6405/10070 [3:02:59<1:44:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6406/10070 [3:03:00<1:44:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6406/10070 [3:03:00<1:44:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6407/10070 [3:03:01<1:44:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6407/10070 [3:03:01<1:44:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6408/10070 [3:03:03<1:44:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6408/10070 [3:03:03<1:44:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6409/10070 [3:03:05<1:44:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6409/10070 [3:03:05<1:44:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6410/10070 [3:03:07<1:44:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6410/10070 [3:03:07<1:44:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6411/10070 [3:03:08<1:44:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6411/10070 [3:03:08<1:44:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6412/10070 [3:03:08<1:44:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6412/10070 [3:03:08<1:44:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6413/10070 [3:03:10<1:44:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6413/10070 [3:03:10<1:44:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6414/10070 [3:03:12<1:44:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6414/10070 [3:03:12<1:44:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6415/10070 [3:03:14<1:44:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6415/10070 [3:03:14<1:44:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6416/10070 [3:03:15<1:44:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6416/10070 [3:03:15<1:44:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6417/10070 [3:03:18<1:44:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6417/10070 [3:03:18<1:44:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6418/10070 [3:03:18<1:44:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6418/10070 [3:03:18<1:44:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6419/10070 [3:03:20<1:44:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6419/10070 [3:03:20<1:44:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6420/10070 [3:03:21<1:44:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6420/10070 [3:03:21<1:44:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6421/10070 [3:03:23<1:44:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6421/10070 [3:03:23<1:44:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6422/10070 [3:03:24<1:44:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6422/10070 [3:03:24<1:44:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6423/10070 [3:03:26<1:44:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6423/10070 [3:03:26<1:44:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6424/10070 [3:03:27<1:44:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6424/10070 [3:03:27<1:44:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6425/10070 [3:03:28<1:44:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6425/10070 [3:03:28<1:44:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6426/10070 [3:03:29<1:44:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6426/10070 [3:03:29<1:44:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6427/10070 [3:03:31<1:44:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6427/10070 [3:03:31<1:44:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6428/10070 [3:03:32<1:43:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6428/10070 [3:03:32<1:43:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6429/10070 [3:03:33<1:43:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6429/10070 [3:03:33<1:43:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6430/10070 [3:03:34<1:43:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6430/10070 [3:03:34<1:43:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6431/10070 [3:03:35<1:43:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6431/10070 [3:03:35<1:43:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6432/10070 [3:03:45<1:43:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6432/10070 [3:03:45<1:43:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6433/10070 [3:03:46<1:43:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6433/10070 [3:03:46<1:43:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6434/10070 [3:03:47<1:43:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6434/10070 [3:03:47<1:43:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6435/10070 [3:03:48<1:43:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6435/10070 [3:03:48<1:43:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6436/10070 [3:03:49<1:43:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6436/10070 [3:03:49<1:43:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6437/10070 [3:03:50<1:43:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6437/10070 [3:03:50<1:43:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6438/10070 [3:03:52<1:43:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6438/10070 [3:03:52<1:43:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6439/10070 [3:03:53<1:43:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6439/10070 [3:03:53<1:43:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6440/10070 [3:03:55<1:43:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6440/10070 [3:03:55<1:43:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6441/10070 [3:03:57<1:43:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6441/10070 [3:03:57<1:43:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6442/10070 [3:03:57<1:43:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6442/10070 [3:03:57<1:43:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6443/10070 [3:03:59<1:43:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6443/10070 [3:03:59<1:43:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6444/10070 [3:04:01<1:43:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6444/10070 [3:04:01<1:43:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6445/10070 [3:04:03<1:43:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6445/10070 [3:04:03<1:43:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6446/10070 [3:04:05<1:43:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6446/10070 [3:04:05<1:43:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6447/10070 [3:04:06<1:43:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6447/10070 [3:04:06<1:43:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6448/10070 [3:04:08<1:43:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6448/10070 [3:04:08<1:43:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6449/10070 [3:04:09<1:43:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6449/10070 [3:04:09<1:43:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6450/10070 [3:04:10<1:43:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6450/10070 [3:04:10<1:43:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6451/10070 [3:04:13<1:43:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6451/10070 [3:04:13<1:43:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6452/10070 [3:04:13<1:43:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6452/10070 [3:04:13<1:43:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6453/10070 [3:04:14<1:43:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6453/10070 [3:04:14<1:43:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6454/10070 [3:04:17<1:43:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6454/10070 [3:04:17<1:43:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6455/10070 [3:04:17<1:43:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6455/10070 [3:04:17<1:43:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6456/10070 [3:04:19<1:43:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6456/10070 [3:04:19<1:43:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6457/10070 [3:04:20<1:43:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6457/10070 [3:04:20<1:43:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6458/10070 [3:04:20<1:43:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6458/10070 [3:04:20<1:43:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6459/10070 [3:04:22<1:43:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6459/10070 [3:04:22<1:43:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6460/10070 [3:04:23<1:43:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6460/10070 [3:04:23<1:43:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6461/10070 [3:04:24<1:43:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6461/10070 [3:04:24<1:43:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6462/10070 [3:04:27<1:42:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6462/10070 [3:04:27<1:42:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6463/10070 [3:04:28<1:42:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6463/10070 [3:04:28<1:42:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6464/10070 [3:04:38<1:43:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6464/10070 [3:04:38<1:43:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6465/10070 [3:04:40<1:42:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6465/10070 [3:04:40<1:42:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6466/10070 [3:04:41<1:42:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6466/10070 [3:04:41<1:42:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6467/10070 [3:04:42<1:42:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6467/10070 [3:04:42<1:42:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6468/10070 [3:04:42<1:42:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6468/10070 [3:04:42<1:42:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6469/10070 [3:04:45<1:42:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6469/10070 [3:04:45<1:42:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6470/10070 [3:04:45<1:42:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6470/10070 [3:04:45<1:42:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6471/10070 [3:04:47<1:42:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6471/10070 [3:04:47<1:42:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6472/10070 [3:04:48<1:42:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6472/10070 [3:04:48<1:42:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6473/10070 [3:04:48<1:42:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6473/10070 [3:04:48<1:42:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6474/10070 [3:04:49<1:42:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6474/10070 [3:04:49<1:42:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6475/10070 [3:04:50<1:42:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6475/10070 [3:04:50<1:42:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6476/10070 [3:04:52<1:42:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6476/10070 [3:04:52<1:42:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6477/10070 [3:04:54<1:42:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6477/10070 [3:04:54<1:42:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6478/10070 [3:04:55<1:42:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6478/10070 [3:04:55<1:42:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6479/10070 [3:04:56<1:42:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6479/10070 [3:04:56<1:42:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6480/10070 [3:04:57<1:42:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6480/10070 [3:04:57<1:42:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6481/10070 [3:04:58<1:42:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6481/10070 [3:04:58<1:42:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6482/10070 [3:04:59<1:42:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6482/10070 [3:04:59<1:42:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6483/10070 [3:05:01<1:42:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6483/10070 [3:05:01<1:42:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6484/10070 [3:05:02<1:42:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6484/10070 [3:05:02<1:42:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6485/10070 [3:05:03<1:42:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6485/10070 [3:05:03<1:42:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6486/10070 [3:05:04<1:42:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6486/10070 [3:05:04<1:42:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6487/10070 [3:05:05<1:42:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6487/10070 [3:05:05<1:42:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6488/10070 [3:05:06<1:42:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6488/10070 [3:05:06<1:42:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6489/10070 [3:05:07<1:42:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6489/10070 [3:05:07<1:42:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6490/10070 [3:05:08<1:42:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6490/10070 [3:05:08<1:42:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6491/10070 [3:05:08<1:42:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6491/10070 [3:05:08<1:42:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6492/10070 [3:05:10<1:42:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6492/10070 [3:05:10<1:42:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6493/10070 [3:05:11<1:42:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6493/10070 [3:05:11<1:42:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6494/10070 [3:05:11<1:41:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6494/10070 [3:05:11<1:41:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  64%|▋| 6495/10070 [3:05:13<1:41:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  64%|▋| 6495/10070 [3:05:13<1:41:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6496/10070 [3:05:32<1:42:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6496/10070 [3:05:32<1:42:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6497/10070 [3:05:33<1:42:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6497/10070 [3:05:33<1:42:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6498/10070 [3:05:34<1:42:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6498/10070 [3:05:34<1:42:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6499/10070 [3:05:36<1:41:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6499/10070 [3:05:36<1:41:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6500/10070 [3:05:37<1:41:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6500/10070 [3:05:37<1:41:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6501/10070 [3:05:38<1:41:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6501/10070 [3:05:38<1:41:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6502/10070 [3:05:40<1:41:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6502/10070 [3:05:40<1:41:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6503/10070 [3:05:41<1:41:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6503/10070 [3:05:41<1:41:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6504/10070 [3:05:42<1:41:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6504/10070 [3:05:42<1:41:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6505/10070 [3:05:44<1:41:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6505/10070 [3:05:44<1:41:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6506/10070 [3:05:46<1:41:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6506/10070 [3:05:46<1:41:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6507/10070 [3:05:47<1:41:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6507/10070 [3:05:47<1:41:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6508/10070 [3:05:49<1:41:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6508/10070 [3:05:49<1:41:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6509/10070 [3:05:50<1:41:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6509/10070 [3:05:50<1:41:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6510/10070 [3:05:52<1:41:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6510/10070 [3:05:52<1:41:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6511/10070 [3:05:53<1:41:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6511/10070 [3:05:53<1:41:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6512/10070 [3:05:54<1:41:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6512/10070 [3:05:54<1:41:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6513/10070 [3:05:56<1:41:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6513/10070 [3:05:56<1:41:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6514/10070 [3:05:56<1:41:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6514/10070 [3:05:56<1:41:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6515/10070 [3:05:57<1:41:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6515/10070 [3:05:57<1:41:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6516/10070 [3:05:59<1:41:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6516/10070 [3:05:59<1:41:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6517/10070 [3:06:00<1:41:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6517/10070 [3:06:00<1:41:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6518/10070 [3:06:00<1:41:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6518/10070 [3:06:00<1:41:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6519/10070 [3:06:02<1:41:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6519/10070 [3:06:02<1:41:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6520/10070 [3:06:04<1:41:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6520/10070 [3:06:04<1:41:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6521/10070 [3:06:05<1:41:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6521/10070 [3:06:05<1:41:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6522/10070 [3:06:08<1:41:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6522/10070 [3:06:08<1:41:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6523/10070 [3:06:10<1:41:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6523/10070 [3:06:10<1:41:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6524/10070 [3:06:11<1:41:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6524/10070 [3:06:11<1:41:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6525/10070 [3:06:12<1:41:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6525/10070 [3:06:12<1:41:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6526/10070 [3:06:14<1:41:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6526/10070 [3:06:14<1:41:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6527/10070 [3:06:15<1:41:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6527/10070 [3:06:15<1:41:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6528/10070 [3:06:25<1:41:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6528/10070 [3:06:25<1:41:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6529/10070 [3:06:26<1:41:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6529/10070 [3:06:26<1:41:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6530/10070 [3:06:27<1:41:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6530/10070 [3:06:27<1:41:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6531/10070 [3:06:29<1:41:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6531/10070 [3:06:29<1:41:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6532/10070 [3:06:31<1:41:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6532/10070 [3:06:31<1:41:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6533/10070 [3:06:32<1:40:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6533/10070 [3:06:32<1:40:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6534/10070 [3:06:34<1:40:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6534/10070 [3:06:34<1:40:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6535/10070 [3:06:35<1:40:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6535/10070 [3:06:35<1:40:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6536/10070 [3:06:36<1:40:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6536/10070 [3:06:36<1:40:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6537/10070 [3:06:37<1:40:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6537/10070 [3:06:37<1:40:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6538/10070 [3:06:39<1:40:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6538/10070 [3:06:39<1:40:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6539/10070 [3:06:40<1:40:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6539/10070 [3:06:40<1:40:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6540/10070 [3:06:42<1:40:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6540/10070 [3:06:42<1:40:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6541/10070 [3:06:44<1:40:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6541/10070 [3:06:44<1:40:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6542/10070 [3:06:45<1:40:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6542/10070 [3:06:45<1:40:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6543/10070 [3:06:48<1:40:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6543/10070 [3:06:48<1:40:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6544/10070 [3:06:50<1:40:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6544/10070 [3:06:50<1:40:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6545/10070 [3:06:52<1:40:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6545/10070 [3:06:52<1:40:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6546/10070 [3:06:53<1:40:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6546/10070 [3:06:53<1:40:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6547/10070 [3:06:56<1:40:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6547/10070 [3:06:56<1:40:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6548/10070 [3:06:56<1:40:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6548/10070 [3:06:56<1:40:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6549/10070 [3:06:57<1:40:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6549/10070 [3:06:57<1:40:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6550/10070 [3:07:00<1:40:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6550/10070 [3:07:00<1:40:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6551/10070 [3:07:01<1:40:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6551/10070 [3:07:01<1:40:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6552/10070 [3:07:02<1:40:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6552/10070 [3:07:02<1:40:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6553/10070 [3:07:02<1:40:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6553/10070 [3:07:02<1:40:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6554/10070 [3:07:03<1:40:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6554/10070 [3:07:03<1:40:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6555/10070 [3:07:05<1:40:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6555/10070 [3:07:05<1:40:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6556/10070 [3:07:07<1:40:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6556/10070 [3:07:07<1:40:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6557/10070 [3:07:09<1:40:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6557/10070 [3:07:09<1:40:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6558/10070 [3:07:10<1:40:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6558/10070 [3:07:10<1:40:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6559/10070 [3:07:11<1:40:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6559/10070 [3:07:11<1:40:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6560/10070 [3:07:17<1:40:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6560/10070 [3:07:17<1:40:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6561/10070 [3:07:18<1:40:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6561/10070 [3:07:18<1:40:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6562/10070 [3:07:19<1:40:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6562/10070 [3:07:19<1:40:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6563/10070 [3:07:20<1:40:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6563/10070 [3:07:20<1:40:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6564/10070 [3:07:22<1:40:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6564/10070 [3:07:22<1:40:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6565/10070 [3:07:24<1:40:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6565/10070 [3:07:24<1:40:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6566/10070 [3:07:24<1:40:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6566/10070 [3:07:24<1:40:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6567/10070 [3:07:27<1:39:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6567/10070 [3:07:27<1:39:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6568/10070 [3:07:29<1:39:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6568/10070 [3:07:29<1:39:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6569/10070 [3:07:30<1:39:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6569/10070 [3:07:30<1:39:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6570/10070 [3:07:31<1:39:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6570/10070 [3:07:31<1:39:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6571/10070 [3:07:32<1:39:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6571/10070 [3:07:32<1:39:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6572/10070 [3:07:34<1:39:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6572/10070 [3:07:34<1:39:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6573/10070 [3:07:35<1:39:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6573/10070 [3:07:35<1:39:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6574/10070 [3:07:36<1:39:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6574/10070 [3:07:36<1:39:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6575/10070 [3:07:37<1:39:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6575/10070 [3:07:37<1:39:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6576/10070 [3:07:37<1:39:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6576/10070 [3:07:37<1:39:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6577/10070 [3:07:38<1:39:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6577/10070 [3:07:38<1:39:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6578/10070 [3:07:41<1:39:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6578/10070 [3:07:41<1:39:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6579/10070 [3:07:42<1:39:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6579/10070 [3:07:42<1:39:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6580/10070 [3:07:45<1:39:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6580/10070 [3:07:45<1:39:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6581/10070 [3:07:46<1:39:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6581/10070 [3:07:46<1:39:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6582/10070 [3:07:47<1:39:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6582/10070 [3:07:47<1:39:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6583/10070 [3:07:48<1:39:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6583/10070 [3:07:48<1:39:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6584/10070 [3:07:49<1:39:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6584/10070 [3:07:49<1:39:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6585/10070 [3:07:50<1:39:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6585/10070 [3:07:50<1:39:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6586/10070 [3:07:52<1:39:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6586/10070 [3:07:52<1:39:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6587/10070 [3:07:53<1:39:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6587/10070 [3:07:53<1:39:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6588/10070 [3:07:55<1:39:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6588/10070 [3:07:55<1:39:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6589/10070 [3:07:56<1:39:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6589/10070 [3:07:56<1:39:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6590/10070 [3:07:58<1:39:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6590/10070 [3:07:58<1:39:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6591/10070 [3:07:58<1:39:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6591/10070 [3:07:58<1:39:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6592/10070 [3:08:15<1:39:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6592/10070 [3:08:15<1:39:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6593/10070 [3:08:16<1:39:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6593/10070 [3:08:16<1:39:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6594/10070 [3:08:17<1:39:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6594/10070 [3:08:17<1:39:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  65%|▋| 6595/10070 [3:08:18<1:39:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  65%|▋| 6595/10070 [3:08:18<1:39:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6596/10070 [3:08:21<1:39:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6596/10070 [3:08:21<1:39:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6597/10070 [3:08:21<1:39:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6597/10070 [3:08:21<1:39:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6598/10070 [3:08:24<1:39:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6598/10070 [3:08:24<1:39:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6599/10070 [3:08:25<1:39:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6599/10070 [3:08:25<1:39:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6600/10070 [3:08:26<1:39:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6600/10070 [3:08:26<1:39:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6601/10070 [3:08:27<1:39:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6601/10070 [3:08:27<1:39:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6602/10070 [3:08:28<1:39:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6602/10070 [3:08:28<1:39:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6603/10070 [3:08:29<1:38:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6603/10070 [3:08:29<1:38:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6604/10070 [3:08:30<1:38:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6604/10070 [3:08:30<1:38:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6605/10070 [3:08:31<1:38:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6605/10070 [3:08:31<1:38:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6606/10070 [3:08:32<1:38:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6606/10070 [3:08:32<1:38:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6607/10070 [3:08:33<1:38:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6607/10070 [3:08:33<1:38:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6608/10070 [3:08:34<1:38:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6608/10070 [3:08:34<1:38:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6609/10070 [3:08:35<1:38:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6609/10070 [3:08:35<1:38:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6610/10070 [3:08:36<1:38:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6610/10070 [3:08:36<1:38:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6611/10070 [3:08:37<1:38:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6611/10070 [3:08:37<1:38:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6612/10070 [3:08:38<1:38:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6612/10070 [3:08:38<1:38:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6613/10070 [3:08:38<1:38:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6613/10070 [3:08:38<1:38:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6614/10070 [3:08:40<1:38:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6614/10070 [3:08:40<1:38:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6615/10070 [3:08:41<1:38:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6615/10070 [3:08:41<1:38:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6616/10070 [3:08:44<1:38:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6616/10070 [3:08:44<1:38:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6617/10070 [3:08:45<1:38:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6617/10070 [3:08:45<1:38:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6618/10070 [3:08:46<1:38:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6618/10070 [3:08:46<1:38:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6619/10070 [3:08:48<1:38:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6619/10070 [3:08:48<1:38:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6620/10070 [3:08:49<1:38:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6620/10070 [3:08:49<1:38:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6621/10070 [3:08:51<1:38:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6621/10070 [3:08:51<1:38:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6622/10070 [3:08:51<1:38:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6622/10070 [3:08:51<1:38:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6623/10070 [3:08:53<1:38:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6623/10070 [3:08:53<1:38:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6624/10070 [3:09:13<1:38:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6624/10070 [3:09:13<1:38:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6625/10070 [3:09:15<1:38:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6625/10070 [3:09:15<1:38:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6626/10070 [3:09:15<1:38:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6626/10070 [3:09:15<1:38:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6627/10070 [3:09:16<1:38:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6627/10070 [3:09:16<1:38:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6628/10070 [3:09:18<1:38:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6628/10070 [3:09:18<1:38:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6629/10070 [3:09:19<1:38:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6629/10070 [3:09:19<1:38:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6630/10070 [3:09:20<1:38:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6630/10070 [3:09:20<1:38:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6631/10070 [3:09:21<1:38:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6631/10070 [3:09:21<1:38:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6632/10070 [3:09:22<1:38:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6632/10070 [3:09:22<1:38:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6633/10070 [3:09:24<1:38:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6633/10070 [3:09:24<1:38:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6634/10070 [3:09:24<1:38:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6634/10070 [3:09:24<1:38:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6635/10070 [3:09:25<1:38:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6635/10070 [3:09:25<1:38:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6636/10070 [3:09:27<1:38:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6636/10070 [3:09:27<1:38:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6637/10070 [3:09:28<1:38:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6637/10070 [3:09:28<1:38:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6638/10070 [3:09:30<1:37:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6638/10070 [3:09:30<1:37:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6639/10070 [3:09:32<1:37:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6639/10070 [3:09:32<1:37:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6640/10070 [3:09:33<1:37:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6640/10070 [3:09:33<1:37:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6641/10070 [3:09:35<1:37:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6641/10070 [3:09:35<1:37:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6642/10070 [3:09:36<1:37:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6642/10070 [3:09:36<1:37:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6643/10070 [3:09:37<1:37:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6643/10070 [3:09:37<1:37:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6644/10070 [3:09:38<1:37:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6644/10070 [3:09:38<1:37:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6645/10070 [3:09:40<1:37:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6645/10070 [3:09:40<1:37:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6646/10070 [3:09:41<1:37:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6646/10070 [3:09:41<1:37:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6647/10070 [3:09:41<1:37:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6647/10070 [3:09:41<1:37:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6648/10070 [3:09:42<1:37:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6648/10070 [3:09:42<1:37:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6649/10070 [3:09:44<1:37:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6649/10070 [3:09:44<1:37:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6650/10070 [3:09:45<1:37:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6650/10070 [3:09:45<1:37:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6651/10070 [3:09:46<1:37:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6651/10070 [3:09:46<1:37:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6652/10070 [3:09:48<1:37:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6652/10070 [3:09:48<1:37:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6653/10070 [3:09:49<1:37:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6653/10070 [3:09:49<1:37:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6654/10070 [3:09:50<1:37:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6654/10070 [3:09:50<1:37:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6655/10070 [3:09:51<1:37:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6655/10070 [3:09:51<1:37:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6656/10070 [3:10:04<1:37:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6656/10070 [3:10:04<1:37:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6657/10070 [3:10:06<1:37:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6657/10070 [3:10:06<1:37:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6658/10070 [3:10:07<1:37:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6658/10070 [3:10:07<1:37:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6659/10070 [3:10:08<1:37:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6659/10070 [3:10:08<1:37:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6660/10070 [3:10:09<1:37:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6660/10070 [3:10:09<1:37:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6661/10070 [3:10:10<1:37:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6661/10070 [3:10:10<1:37:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6662/10070 [3:10:12<1:37:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6662/10070 [3:10:12<1:37:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6663/10070 [3:10:13<1:37:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6663/10070 [3:10:13<1:37:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6664/10070 [3:10:14<1:37:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6664/10070 [3:10:14<1:37:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6665/10070 [3:10:16<1:37:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6665/10070 [3:10:16<1:37:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6666/10070 [3:10:16<1:37:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6666/10070 [3:10:16<1:37:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6667/10070 [3:10:17<1:37:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6667/10070 [3:10:17<1:37:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6668/10070 [3:10:19<1:37:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6668/10070 [3:10:19<1:37:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6669/10070 [3:10:20<1:37:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6669/10070 [3:10:20<1:37:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6670/10070 [3:10:21<1:37:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6670/10070 [3:10:21<1:37:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6671/10070 [3:10:23<1:37:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6671/10070 [3:10:23<1:37:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6672/10070 [3:10:25<1:36:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6672/10070 [3:10:25<1:36:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6673/10070 [3:10:26<1:36:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6673/10070 [3:10:26<1:36:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6674/10070 [3:10:28<1:36:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6674/10070 [3:10:28<1:36:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6675/10070 [3:10:30<1:36:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6675/10070 [3:10:30<1:36:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6676/10070 [3:10:32<1:36:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6676/10070 [3:10:32<1:36:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6677/10070 [3:10:33<1:36:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6677/10070 [3:10:33<1:36:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6678/10070 [3:10:35<1:36:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6678/10070 [3:10:35<1:36:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6679/10070 [3:10:36<1:36:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6679/10070 [3:10:36<1:36:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6680/10070 [3:10:37<1:36:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6680/10070 [3:10:37<1:36:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6681/10070 [3:10:38<1:36:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6681/10070 [3:10:38<1:36:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6682/10070 [3:10:39<1:36:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6682/10070 [3:10:39<1:36:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6683/10070 [3:10:40<1:36:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6683/10070 [3:10:40<1:36:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6684/10070 [3:10:42<1:36:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6684/10070 [3:10:42<1:36:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6685/10070 [3:10:44<1:36:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6685/10070 [3:10:44<1:36:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6686/10070 [3:10:47<1:36:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6686/10070 [3:10:47<1:36:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6687/10070 [3:10:49<1:36:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6687/10070 [3:10:49<1:36:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6688/10070 [3:10:56<1:36:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6688/10070 [3:10:56<1:36:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6689/10070 [3:10:57<1:36:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6689/10070 [3:10:57<1:36:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6690/10070 [3:10:58<1:36:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6690/10070 [3:10:58<1:36:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6691/10070 [3:11:01<1:36:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6691/10070 [3:11:01<1:36:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6692/10070 [3:11:01<1:36:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6692/10070 [3:11:01<1:36:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6693/10070 [3:11:02<1:36:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6693/10070 [3:11:02<1:36:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6694/10070 [3:11:03<1:36:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6694/10070 [3:11:03<1:36:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6695/10070 [3:11:05<1:36:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6695/10070 [3:11:05<1:36:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  66%|▋| 6696/10070 [3:11:06<1:36:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  66%|▋| 6696/10070 [3:11:06<1:36:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6697/10070 [3:11:07<1:36:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6697/10070 [3:11:07<1:36:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6698/10070 [3:11:09<1:36:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6698/10070 [3:11:09<1:36:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6699/10070 [3:11:10<1:36:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6699/10070 [3:11:10<1:36:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6700/10070 [3:11:11<1:36:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6700/10070 [3:11:11<1:36:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6701/10070 [3:11:12<1:36:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6701/10070 [3:11:12<1:36:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6702/10070 [3:11:14<1:36:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6702/10070 [3:11:14<1:36:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6703/10070 [3:11:14<1:36:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6703/10070 [3:11:14<1:36:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6704/10070 [3:11:16<1:36:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6704/10070 [3:11:16<1:36:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6705/10070 [3:11:18<1:36:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6705/10070 [3:11:18<1:36:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6706/10070 [3:11:21<1:35:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6706/10070 [3:11:21<1:35:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6707/10070 [3:11:23<1:35:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6707/10070 [3:11:23<1:35:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6708/10070 [3:11:24<1:35:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6708/10070 [3:11:24<1:35:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6709/10070 [3:11:25<1:35:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6709/10070 [3:11:25<1:35:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6710/10070 [3:11:27<1:35:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6710/10070 [3:11:27<1:35:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6711/10070 [3:11:29<1:35:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6711/10070 [3:11:29<1:35:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6712/10070 [3:11:30<1:35:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6712/10070 [3:11:30<1:35:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6713/10070 [3:11:32<1:35:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6713/10070 [3:11:32<1:35:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6714/10070 [3:11:34<1:35:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6714/10070 [3:11:34<1:35:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6715/10070 [3:11:36<1:35:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6715/10070 [3:11:36<1:35:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6716/10070 [3:11:38<1:35:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6716/10070 [3:11:38<1:35:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6717/10070 [3:11:39<1:35:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6717/10070 [3:11:39<1:35:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6718/10070 [3:11:39<1:35:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6718/10070 [3:11:39<1:35:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6719/10070 [3:11:41<1:35:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6719/10070 [3:11:41<1:35:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6720/10070 [3:11:52<1:35:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6720/10070 [3:11:52<1:35:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6721/10070 [3:11:53<1:35:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6721/10070 [3:11:53<1:35:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6722/10070 [3:11:54<1:35:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6722/10070 [3:11:54<1:35:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6723/10070 [3:11:56<1:35:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6723/10070 [3:11:56<1:35:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6724/10070 [3:11:57<1:35:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6724/10070 [3:11:57<1:35:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6725/10070 [3:11:58<1:35:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6725/10070 [3:11:58<1:35:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6726/10070 [3:12:00<1:35:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6726/10070 [3:12:00<1:35:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6727/10070 [3:12:02<1:35:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6727/10070 [3:12:02<1:35:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6728/10070 [3:12:05<1:35:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6728/10070 [3:12:05<1:35:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6729/10070 [3:12:06<1:35:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6729/10070 [3:12:06<1:35:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6730/10070 [3:12:07<1:35:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6730/10070 [3:12:07<1:35:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6731/10070 [3:12:09<1:35:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6731/10070 [3:12:09<1:35:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6732/10070 [3:12:11<1:35:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6732/10070 [3:12:11<1:35:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6733/10070 [3:12:12<1:35:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6733/10070 [3:12:12<1:35:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6734/10070 [3:12:12<1:35:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6734/10070 [3:12:12<1:35:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6735/10070 [3:12:15<1:35:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6735/10070 [3:12:15<1:35:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6736/10070 [3:12:15<1:35:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6736/10070 [3:12:15<1:35:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6737/10070 [3:12:16<1:35:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6737/10070 [3:12:16<1:35:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6738/10070 [3:12:19<1:35:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6738/10070 [3:12:19<1:35:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6739/10070 [3:12:21<1:35:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6739/10070 [3:12:21<1:35:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6740/10070 [3:12:23<1:35:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6740/10070 [3:12:23<1:35:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6741/10070 [3:12:25<1:35:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6741/10070 [3:12:25<1:35:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6742/10070 [3:12:25<1:34:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6742/10070 [3:12:25<1:34:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6743/10070 [3:12:26<1:34:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6743/10070 [3:12:26<1:34:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6744/10070 [3:12:27<1:34:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6744/10070 [3:12:27<1:34:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6745/10070 [3:12:28<1:34:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6745/10070 [3:12:28<1:34:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6746/10070 [3:12:29<1:34:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6746/10070 [3:12:29<1:34:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6747/10070 [3:12:31<1:34:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6747/10070 [3:12:31<1:34:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6748/10070 [3:12:33<1:34:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6748/10070 [3:12:33<1:34:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6749/10070 [3:12:34<1:34:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6749/10070 [3:12:34<1:34:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6750/10070 [3:12:36<1:34:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6750/10070 [3:12:36<1:34:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6751/10070 [3:12:38<1:34:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6751/10070 [3:12:38<1:34:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6752/10070 [3:12:46<1:34:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6752/10070 [3:12:46<1:34:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6753/10070 [3:12:48<1:34:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6753/10070 [3:12:48<1:34:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6754/10070 [3:12:49<1:34:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6754/10070 [3:12:49<1:34:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6755/10070 [3:12:50<1:34:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6755/10070 [3:12:50<1:34:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6756/10070 [3:12:51<1:34:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6756/10070 [3:12:51<1:34:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6757/10070 [3:12:53<1:34:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6757/10070 [3:12:53<1:34:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6758/10070 [3:12:54<1:34:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6758/10070 [3:12:54<1:34:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6759/10070 [3:12:54<1:34:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6759/10070 [3:12:54<1:34:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6760/10070 [3:12:56<1:34:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6760/10070 [3:12:56<1:34:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6761/10070 [3:12:57<1:34:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6761/10070 [3:12:57<1:34:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6762/10070 [3:12:59<1:34:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6762/10070 [3:12:59<1:34:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6763/10070 [3:13:02<1:34:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6763/10070 [3:13:02<1:34:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6764/10070 [3:13:04<1:34:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6764/10070 [3:13:04<1:34:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6765/10070 [3:13:05<1:34:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6765/10070 [3:13:05<1:34:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6766/10070 [3:13:05<1:34:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6766/10070 [3:13:05<1:34:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6767/10070 [3:13:06<1:34:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6767/10070 [3:13:06<1:34:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6768/10070 [3:13:09<1:34:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6768/10070 [3:13:09<1:34:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6769/10070 [3:13:10<1:34:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6769/10070 [3:13:10<1:34:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6770/10070 [3:13:11<1:34:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6770/10070 [3:13:11<1:34:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6771/10070 [3:13:12<1:34:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6771/10070 [3:13:12<1:34:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6772/10070 [3:13:15<1:34:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6772/10070 [3:13:15<1:34:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6773/10070 [3:13:16<1:34:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6773/10070 [3:13:16<1:34:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6774/10070 [3:13:17<1:34:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6774/10070 [3:13:17<1:34:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6775/10070 [3:13:20<1:34:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6775/10070 [3:13:20<1:34:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6776/10070 [3:13:21<1:33:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6776/10070 [3:13:21<1:33:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6777/10070 [3:13:22<1:33:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6777/10070 [3:13:22<1:33:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6778/10070 [3:13:24<1:33:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6778/10070 [3:13:24<1:33:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6779/10070 [3:13:26<1:33:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6779/10070 [3:13:26<1:33:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6780/10070 [3:13:27<1:33:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6780/10070 [3:13:27<1:33:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6781/10070 [3:13:28<1:33:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6781/10070 [3:13:28<1:33:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6782/10070 [3:13:30<1:33:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6782/10070 [3:13:30<1:33:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6783/10070 [3:13:32<1:33:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6783/10070 [3:13:32<1:33:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6784/10070 [3:13:38<1:33:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6784/10070 [3:13:38<1:33:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6785/10070 [3:13:39<1:33:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6785/10070 [3:13:39<1:33:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6786/10070 [3:13:41<1:33:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6786/10070 [3:13:41<1:33:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6787/10070 [3:13:43<1:33:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6787/10070 [3:13:43<1:33:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6788/10070 [3:13:44<1:33:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6788/10070 [3:13:44<1:33:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6789/10070 [3:13:45<1:33:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6789/10070 [3:13:45<1:33:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6790/10070 [3:13:46<1:33:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6790/10070 [3:13:46<1:33:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6791/10070 [3:13:47<1:33:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6791/10070 [3:13:47<1:33:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6792/10070 [3:13:48<1:33:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6792/10070 [3:13:48<1:33:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6793/10070 [3:13:50<1:33:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6793/10070 [3:13:50<1:33:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6794/10070 [3:13:52<1:33:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6794/10070 [3:13:52<1:33:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6795/10070 [3:13:54<1:33:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6795/10070 [3:13:54<1:33:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6796/10070 [3:13:54<1:33:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6796/10070 [3:13:54<1:33:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  67%|▋| 6797/10070 [3:13:55<1:33:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  67%|▋| 6797/10070 [3:13:55<1:33:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6798/10070 [3:13:57<1:33:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6798/10070 [3:13:57<1:33:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6799/10070 [3:13:59<1:33:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6799/10070 [3:13:59<1:33:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6800/10070 [3:14:01<1:33:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6800/10070 [3:14:01<1:33:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6801/10070 [3:14:03<1:33:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6801/10070 [3:14:03<1:33:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6802/10070 [3:14:04<1:33:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6802/10070 [3:14:04<1:33:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6803/10070 [3:14:05<1:33:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6803/10070 [3:14:05<1:33:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6804/10070 [3:14:06<1:33:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6804/10070 [3:14:06<1:33:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6805/10070 [3:14:07<1:33:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6805/10070 [3:14:07<1:33:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6806/10070 [3:14:10<1:33:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6806/10070 [3:14:10<1:33:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6807/10070 [3:14:12<1:33:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6807/10070 [3:14:12<1:33:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6808/10070 [3:14:13<1:33:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6808/10070 [3:14:13<1:33:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6809/10070 [3:14:14<1:33:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6809/10070 [3:14:14<1:33:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6810/10070 [3:14:16<1:32:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6810/10070 [3:14:16<1:32:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6811/10070 [3:14:17<1:32:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6811/10070 [3:14:17<1:32:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6812/10070 [3:14:20<1:32:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6812/10070 [3:14:20<1:32:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6813/10070 [3:14:21<1:32:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6813/10070 [3:14:21<1:32:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6814/10070 [3:14:22<1:32:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6814/10070 [3:14:22<1:32:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6815/10070 [3:14:23<1:32:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6815/10070 [3:14:23<1:32:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6816/10070 [3:14:32<1:32:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6816/10070 [3:14:32<1:32:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6817/10070 [3:14:34<1:32:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6817/10070 [3:14:34<1:32:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6818/10070 [3:14:36<1:32:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6818/10070 [3:14:36<1:32:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6819/10070 [3:14:37<1:32:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6819/10070 [3:14:37<1:32:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6820/10070 [3:14:38<1:32:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6820/10070 [3:14:38<1:32:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6821/10070 [3:14:40<1:32:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6821/10070 [3:14:40<1:32:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6822/10070 [3:14:42<1:32:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6822/10070 [3:14:42<1:32:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6823/10070 [3:14:42<1:32:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6823/10070 [3:14:42<1:32:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6824/10070 [3:14:43<1:32:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6824/10070 [3:14:43<1:32:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6825/10070 [3:14:44<1:32:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6825/10070 [3:14:44<1:32:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6826/10070 [3:14:45<1:32:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6826/10070 [3:14:45<1:32:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6827/10070 [3:14:46<1:32:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6827/10070 [3:14:46<1:32:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6828/10070 [3:14:48<1:32:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6828/10070 [3:14:48<1:32:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6829/10070 [3:14:48<1:32:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6829/10070 [3:14:48<1:32:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6830/10070 [3:14:50<1:32:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6830/10070 [3:14:50<1:32:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6831/10070 [3:14:51<1:32:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6831/10070 [3:14:51<1:32:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6832/10070 [3:14:52<1:32:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6832/10070 [3:14:52<1:32:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6833/10070 [3:14:54<1:32:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6833/10070 [3:14:54<1:32:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6834/10070 [3:14:55<1:32:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6834/10070 [3:14:55<1:32:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6835/10070 [3:14:56<1:32:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6835/10070 [3:14:56<1:32:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6836/10070 [3:14:57<1:32:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6836/10070 [3:14:57<1:32:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6837/10070 [3:14:58<1:32:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6837/10070 [3:14:58<1:32:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6838/10070 [3:15:00<1:32:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6838/10070 [3:15:00<1:32:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6839/10070 [3:15:01<1:32:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6839/10070 [3:15:01<1:32:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6840/10070 [3:15:02<1:32:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6840/10070 [3:15:02<1:32:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6841/10070 [3:15:03<1:32:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6841/10070 [3:15:03<1:32:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6842/10070 [3:15:04<1:32:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6842/10070 [3:15:04<1:32:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6843/10070 [3:15:06<1:32:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6843/10070 [3:15:06<1:32:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6844/10070 [3:15:07<1:31:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6844/10070 [3:15:07<1:31:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6845/10070 [3:15:09<1:31:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6845/10070 [3:15:09<1:31:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6846/10070 [3:15:11<1:31:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6846/10070 [3:15:11<1:31:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6847/10070 [3:15:12<1:31:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6847/10070 [3:15:12<1:31:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6848/10070 [3:15:25<1:31:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6848/10070 [3:15:25<1:31:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6849/10070 [3:15:26<1:31:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6849/10070 [3:15:26<1:31:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6850/10070 [3:15:29<1:31:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6850/10070 [3:15:29<1:31:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6851/10070 [3:15:31<1:31:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6851/10070 [3:15:31<1:31:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6852/10070 [3:15:33<1:31:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6852/10070 [3:15:33<1:31:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6853/10070 [3:15:34<1:31:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6853/10070 [3:15:34<1:31:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6854/10070 [3:15:34<1:31:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6854/10070 [3:15:34<1:31:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6855/10070 [3:15:37<1:31:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6855/10070 [3:15:37<1:31:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6856/10070 [3:15:38<1:31:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6856/10070 [3:15:38<1:31:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6857/10070 [3:15:39<1:31:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6857/10070 [3:15:39<1:31:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6858/10070 [3:15:40<1:31:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6858/10070 [3:15:40<1:31:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6859/10070 [3:15:41<1:31:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6859/10070 [3:15:41<1:31:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6860/10070 [3:15:41<1:31:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6860/10070 [3:15:41<1:31:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6861/10070 [3:15:42<1:31:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6861/10070 [3:15:42<1:31:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6862/10070 [3:15:43<1:31:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6862/10070 [3:15:43<1:31:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6863/10070 [3:15:44<1:31:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6863/10070 [3:15:44<1:31:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6864/10070 [3:15:46<1:31:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6864/10070 [3:15:46<1:31:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6865/10070 [3:15:47<1:31:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6865/10070 [3:15:47<1:31:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6866/10070 [3:15:49<1:31:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6866/10070 [3:15:49<1:31:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6867/10070 [3:15:51<1:31:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6867/10070 [3:15:51<1:31:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6868/10070 [3:15:54<1:31:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6868/10070 [3:15:54<1:31:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6869/10070 [3:15:55<1:31:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6869/10070 [3:15:55<1:31:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6870/10070 [3:15:56<1:31:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6870/10070 [3:15:56<1:31:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6871/10070 [3:15:57<1:31:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6871/10070 [3:15:57<1:31:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6872/10070 [3:15:58<1:31:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6872/10070 [3:15:58<1:31:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6873/10070 [3:15:59<1:31:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6873/10070 [3:15:59<1:31:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6874/10070 [3:16:00<1:31:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6874/10070 [3:16:00<1:31:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6875/10070 [3:16:02<1:31:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6875/10070 [3:16:02<1:31:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6876/10070 [3:16:02<1:31:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6876/10070 [3:16:02<1:31:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6877/10070 [3:16:04<1:31:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6877/10070 [3:16:04<1:31:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6878/10070 [3:16:05<1:31:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6878/10070 [3:16:05<1:31:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6879/10070 [3:16:06<1:30:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6879/10070 [3:16:06<1:30:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6880/10070 [3:16:18<1:31:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6880/10070 [3:16:18<1:31:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6881/10070 [3:16:19<1:30:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6881/10070 [3:16:19<1:30:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6882/10070 [3:16:20<1:30:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6882/10070 [3:16:20<1:30:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6883/10070 [3:16:21<1:30:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6883/10070 [3:16:21<1:30:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6884/10070 [3:16:23<1:30:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6884/10070 [3:16:23<1:30:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6885/10070 [3:16:24<1:30:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6885/10070 [3:16:24<1:30:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6886/10070 [3:16:25<1:30:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6886/10070 [3:16:25<1:30:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6887/10070 [3:16:27<1:30:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6887/10070 [3:16:27<1:30:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6888/10070 [3:16:29<1:30:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6888/10070 [3:16:29<1:30:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6889/10070 [3:16:30<1:30:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6889/10070 [3:16:30<1:30:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6890/10070 [3:16:32<1:30:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6890/10070 [3:16:32<1:30:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6891/10070 [3:16:32<1:30:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6891/10070 [3:16:32<1:30:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6892/10070 [3:16:34<1:30:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6892/10070 [3:16:34<1:30:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6893/10070 [3:16:36<1:30:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6893/10070 [3:16:36<1:30:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6894/10070 [3:16:36<1:30:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6894/10070 [3:16:36<1:30:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6895/10070 [3:16:38<1:30:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6895/10070 [3:16:38<1:30:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6896/10070 [3:16:39<1:30:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6896/10070 [3:16:39<1:30:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  68%|▋| 6897/10070 [3:16:40<1:30:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  68%|▋| 6897/10070 [3:16:40<1:30:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6898/10070 [3:16:42<1:30:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6898/10070 [3:16:42<1:30:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6899/10070 [3:16:43<1:30:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6899/10070 [3:16:43<1:30:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6900/10070 [3:16:43<1:30:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6900/10070 [3:16:43<1:30:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6901/10070 [3:16:45<1:30:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6901/10070 [3:16:45<1:30:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|��| 6902/10070 [3:16:47<1:30:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6902/10070 [3:16:47<1:30:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6903/10070 [3:16:48<1:30:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6903/10070 [3:16:48<1:30:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6904/10070 [3:16:50<1:30:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6904/10070 [3:16:50<1:30:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6905/10070 [3:16:52<1:30:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6905/10070 [3:16:52<1:30:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6906/10070 [3:16:54<1:30:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6906/10070 [3:16:54<1:30:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6907/10070 [3:16:56<1:30:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6907/10070 [3:16:56<1:30:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6908/10070 [3:16:57<1:30:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6908/10070 [3:16:57<1:30:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6909/10070 [3:16:58<1:30:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6909/10070 [3:16:58<1:30:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6910/10070 [3:16:59<1:30:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6910/10070 [3:16:59<1:30:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6911/10070 [3:17:00<1:30:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6911/10070 [3:17:00<1:30:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6912/10070 [3:17:07<1:30:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6912/10070 [3:17:07<1:30:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6913/10070 [3:17:09<1:30:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6913/10070 [3:17:09<1:30:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6914/10070 [3:17:09<1:29:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6914/10070 [3:17:09<1:29:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6915/10070 [3:17:10<1:29:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6915/10070 [3:17:10<1:29:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6916/10070 [3:17:11<1:29:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6916/10070 [3:17:11<1:29:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6917/10070 [3:17:13<1:29:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6917/10070 [3:17:13<1:29:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6918/10070 [3:17:15<1:29:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6918/10070 [3:17:15<1:29:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6919/10070 [3:17:16<1:29:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6919/10070 [3:17:16<1:29:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6920/10070 [3:17:18<1:29:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6920/10070 [3:17:18<1:29:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6921/10070 [3:17:19<1:29:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6921/10070 [3:17:19<1:29:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6922/10070 [3:17:20<1:29:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6922/10070 [3:17:20<1:29:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6923/10070 [3:17:21<1:29:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6923/10070 [3:17:21<1:29:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6924/10070 [3:17:23<1:29:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6924/10070 [3:17:23<1:29:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6925/10070 [3:17:25<1:29:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6925/10070 [3:17:25<1:29:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6926/10070 [3:17:27<1:29:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6926/10070 [3:17:27<1:29:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6927/10070 [3:17:29<1:29:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6927/10070 [3:17:29<1:29:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6928/10070 [3:17:29<1:29:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6928/10070 [3:17:29<1:29:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6929/10070 [3:17:30<1:29:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6929/10070 [3:17:30<1:29:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6930/10070 [3:17:31<1:29:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6930/10070 [3:17:31<1:29:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6931/10070 [3:17:32<1:29:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6931/10070 [3:17:32<1:29:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6932/10070 [3:17:34<1:29:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6932/10070 [3:17:34<1:29:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6933/10070 [3:17:35<1:29:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6933/10070 [3:17:35<1:29:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6934/10070 [3:17:36<1:29:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6934/10070 [3:17:36<1:29:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6935/10070 [3:17:37<1:29:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6935/10070 [3:17:37<1:29:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6936/10070 [3:17:38<1:29:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6936/10070 [3:17:38<1:29:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6937/10070 [3:17:40<1:29:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6937/10070 [3:17:40<1:29:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6938/10070 [3:17:42<1:29:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6938/10070 [3:17:42<1:29:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6939/10070 [3:17:43<1:29:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6939/10070 [3:17:43<1:29:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6940/10070 [3:17:44<1:29:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6940/10070 [3:17:44<1:29:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6941/10070 [3:17:44<1:29:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6941/10070 [3:17:44<1:29:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6942/10070 [3:17:46<1:29:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6942/10070 [3:17:46<1:29:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6943/10070 [3:17:48<1:29:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6943/10070 [3:17:48<1:29:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6944/10070 [3:18:01<1:29:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6944/10070 [3:18:01<1:29:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6945/10070 [3:18:02<1:29:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6945/10070 [3:18:02<1:29:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6946/10070 [3:18:03<1:29:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6946/10070 [3:18:03<1:29:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6947/10070 [3:18:05<1:29:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6947/10070 [3:18:05<1:29:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6948/10070 [3:18:07<1:29:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6948/10070 [3:18:07<1:29:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6949/10070 [3:18:08<1:28:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6949/10070 [3:18:08<1:28:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6950/10070 [3:18:08<1:28:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6950/10070 [3:18:08<1:28:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6951/10070 [3:18:10<1:28:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6951/10070 [3:18:10<1:28:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6952/10070 [3:18:12<1:28:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6952/10070 [3:18:12<1:28:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6953/10070 [3:18:13<1:28:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6953/10070 [3:18:13<1:28:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6954/10070 [3:18:15<1:28:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6954/10070 [3:18:15<1:28:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6955/10070 [3:18:16<1:28:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6955/10070 [3:18:16<1:28:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6956/10070 [3:18:18<1:28:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6956/10070 [3:18:18<1:28:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6957/10070 [3:18:18<1:28:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6957/10070 [3:18:18<1:28:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6958/10070 [3:18:19<1:28:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6958/10070 [3:18:19<1:28:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6959/10070 [3:18:21<1:28:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6959/10070 [3:18:21<1:28:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6960/10070 [3:18:23<1:28:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6960/10070 [3:18:23<1:28:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6961/10070 [3:18:25<1:28:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6961/10070 [3:18:25<1:28:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6962/10070 [3:18:27<1:28:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6962/10070 [3:18:27<1:28:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6963/10070 [3:18:28<1:28:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6963/10070 [3:18:28<1:28:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6964/10070 [3:18:30<1:28:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6964/10070 [3:18:30<1:28:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6965/10070 [3:18:32<1:28:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6965/10070 [3:18:32<1:28:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6966/10070 [3:18:33<1:28:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6966/10070 [3:18:33<1:28:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6967/10070 [3:18:34<1:28:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6967/10070 [3:18:34<1:28:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6968/10070 [3:18:35<1:28:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6968/10070 [3:18:35<1:28:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6969/10070 [3:18:36<1:28:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6969/10070 [3:18:36<1:28:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6970/10070 [3:18:37<1:28:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6970/10070 [3:18:37<1:28:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6971/10070 [3:18:38<1:28:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6971/10070 [3:18:38<1:28:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6972/10070 [3:18:39<1:28:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6972/10070 [3:18:39<1:28:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6973/10070 [3:18:41<1:28:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6973/10070 [3:18:41<1:28:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6974/10070 [3:18:42<1:28:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6974/10070 [3:18:42<1:28:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6975/10070 [3:18:43<1:28:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6975/10070 [3:18:43<1:28:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6976/10070 [3:18:53<1:28:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6976/10070 [3:18:53<1:28:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6977/10070 [3:18:54<1:28:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6977/10070 [3:18:54<1:28:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6978/10070 [3:18:56<1:28:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6978/10070 [3:18:56<1:28:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6979/10070 [3:18:58<1:28:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6979/10070 [3:18:58<1:28:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6980/10070 [3:18:59<1:28:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6980/10070 [3:18:59<1:28:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6981/10070 [3:19:00<1:28:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6981/10070 [3:19:00<1:28:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6982/10070 [3:19:03<1:28:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6982/10070 [3:19:03<1:28:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6983/10070 [3:19:03<1:28:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6983/10070 [3:19:03<1:28:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6984/10070 [3:19:06<1:27:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6984/10070 [3:19:06<1:27:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6985/10070 [3:19:07<1:27:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6985/10070 [3:19:07<1:27:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6986/10070 [3:19:08<1:27:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6986/10070 [3:19:08<1:27:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6987/10070 [3:19:10<1:27:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6987/10070 [3:19:10<1:27:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6988/10070 [3:19:11<1:27:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6988/10070 [3:19:11<1:27:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6989/10070 [3:19:14<1:27:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6989/10070 [3:19:14<1:27:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6990/10070 [3:19:14<1:27:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6990/10070 [3:19:14<1:27:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6991/10070 [3:19:16<1:27:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6991/10070 [3:19:16<1:27:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6992/10070 [3:19:16<1:27:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6992/10070 [3:19:16<1:27:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6993/10070 [3:19:17<1:27:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6993/10070 [3:19:17<1:27:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6994/10070 [3:19:18<1:27:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6994/10070 [3:19:18<1:27:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6995/10070 [3:19:19<1:27:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6995/10070 [3:19:19<1:27:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6996/10070 [3:19:20<1:27:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6996/10070 [3:19:20<1:27:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6997/10070 [3:19:21<1:27:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6997/10070 [3:19:21<1:27:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  69%|▋| 6998/10070 [3:19:23<1:27:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  69%|▋| 6998/10070 [3:19:23<1:27:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 6999/10070 [3:19:25<1:27:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 6999/10070 [3:19:25<1:27:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7000/10070 [3:19:27<1:27:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7000/10070 [3:19:27<1:27:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7001/10070 [3:19:27<1:27:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7001/10070 [3:19:27<1:27:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7002/10070 [3:19:28<1:27:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7002/10070 [3:19:28<1:27:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7003/10070 [3:19:30<1:27:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7003/10070 [3:19:30<1:27:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7004/10070 [3:19:31<1:27:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7004/10070 [3:19:31<1:27:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7005/10070 [3:19:33<1:27:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7005/10070 [3:19:33<1:27:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7006/10070 [3:19:34<1:27:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7006/10070 [3:19:34<1:27:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7007/10070 [3:19:35<1:27:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7007/10070 [3:19:35<1:27:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7008/10070 [3:19:54<1:27:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7008/10070 [3:19:54<1:27:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7009/10070 [3:19:55<1:27:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7009/10070 [3:19:55<1:27:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7010/10070 [3:19:56<1:27:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7010/10070 [3:19:56<1:27:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7011/10070 [3:19:57<1:27:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7011/10070 [3:19:57<1:27:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7012/10070 [3:19:57<1:27:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7012/10070 [3:19:57<1:27:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7013/10070 [3:19:59<1:27:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7013/10070 [3:19:59<1:27:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7014/10070 [3:20:01<1:27:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7014/10070 [3:20:01<1:27:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7015/10070 [3:20:03<1:27:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7015/10070 [3:20:03<1:27:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7016/10070 [3:20:03<1:27:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7016/10070 [3:20:03<1:27:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7017/10070 [3:20:04<1:27:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7017/10070 [3:20:04<1:27:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7018/10070 [3:20:06<1:27:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7018/10070 [3:20:06<1:27:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7019/10070 [3:20:08<1:26:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7019/10070 [3:20:08<1:26:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7020/10070 [3:20:10<1:26:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7020/10070 [3:20:10<1:26:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7021/10070 [3:20:12<1:26:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7021/10070 [3:20:12<1:26:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7022/10070 [3:20:14<1:26:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7022/10070 [3:20:14<1:26:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7023/10070 [3:20:15<1:26:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7023/10070 [3:20:15<1:26:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7024/10070 [3:20:16<1:26:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7024/10070 [3:20:16<1:26:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7025/10070 [3:20:18<1:26:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7025/10070 [3:20:18<1:26:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7026/10070 [3:20:19<1:26:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7026/10070 [3:20:19<1:26:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7027/10070 [3:20:21<1:26:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7027/10070 [3:20:21<1:26:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7028/10070 [3:20:21<1:26:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7028/10070 [3:20:21<1:26:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7029/10070 [3:20:24<1:26:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7029/10070 [3:20:24<1:26:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7030/10070 [3:20:25<1:26:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7030/10070 [3:20:25<1:26:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7031/10070 [3:20:26<1:26:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7031/10070 [3:20:26<1:26:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7032/10070 [3:20:27<1:26:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7032/10070 [3:20:27<1:26:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7033/10070 [3:20:29<1:26:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7033/10070 [3:20:29<1:26:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7034/10070 [3:20:30<1:26:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7034/10070 [3:20:30<1:26:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7035/10070 [3:20:31<1:26:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7035/10070 [3:20:31<1:26:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7036/10070 [3:20:33<1:26:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7036/10070 [3:20:33<1:26:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7037/10070 [3:20:34<1:26:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7037/10070 [3:20:34<1:26:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7038/10070 [3:20:35<1:26:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7038/10070 [3:20:35<1:26:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7039/10070 [3:20:36<1:26:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7039/10070 [3:20:36<1:26:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7040/10070 [3:20:51<1:26:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7040/10070 [3:20:51<1:26:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7041/10070 [3:20:53<1:26:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7041/10070 [3:20:53<1:26:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7042/10070 [3:20:53<1:26:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7042/10070 [3:20:53<1:26:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7043/10070 [3:20:55<1:26:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7043/10070 [3:20:55<1:26:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7044/10070 [3:20:56<1:26:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7044/10070 [3:20:56<1:26:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7045/10070 [3:20:58<1:26:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7045/10070 [3:20:58<1:26:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7046/10070 [3:21:00<1:26:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7046/10070 [3:21:00<1:26:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7047/10070 [3:21:02<1:26:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7047/10070 [3:21:02<1:26:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7048/10070 [3:21:03<1:26:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7048/10070 [3:21:03<1:26:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7049/10070 [3:21:04<1:26:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7049/10070 [3:21:04<1:26:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7050/10070 [3:21:05<1:26:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7050/10070 [3:21:05<1:26:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7051/10070 [3:21:05<1:26:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7051/10070 [3:21:05<1:26:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7052/10070 [3:21:06<1:26:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7052/10070 [3:21:06<1:26:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7053/10070 [3:21:07<1:26:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7053/10070 [3:21:07<1:26:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7054/10070 [3:21:10<1:26:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7054/10070 [3:21:10<1:26:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7055/10070 [3:21:10<1:25:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7055/10070 [3:21:10<1:25:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7056/10070 [3:21:11<1:25:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7056/10070 [3:21:11<1:25:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7057/10070 [3:21:12<1:25:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7057/10070 [3:21:12<1:25:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7058/10070 [3:21:13<1:25:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7058/10070 [3:21:13<1:25:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7059/10070 [3:21:14<1:25:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7059/10070 [3:21:14<1:25:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7060/10070 [3:21:15<1:25:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7060/10070 [3:21:15<1:25:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7061/10070 [3:21:16<1:25:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7061/10070 [3:21:16<1:25:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7062/10070 [3:21:18<1:25:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7062/10070 [3:21:18<1:25:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7063/10070 [3:21:21<1:25:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7063/10070 [3:21:21<1:25:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7064/10070 [3:21:23<1:25:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7064/10070 [3:21:23<1:25:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7065/10070 [3:21:25<1:25:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7065/10070 [3:21:25<1:25:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7066/10070 [3:21:25<1:25:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7066/10070 [3:21:25<1:25:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7067/10070 [3:21:27<1:25:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7067/10070 [3:21:27<1:25:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7068/10070 [3:21:28<1:25:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7068/10070 [3:21:28<1:25:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7069/10070 [3:21:29<1:25:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7069/10070 [3:21:29<1:25:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7070/10070 [3:21:30<1:25:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7070/10070 [3:21:30<1:25:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7071/10070 [3:21:31<1:25:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7071/10070 [3:21:31<1:25:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7072/10070 [3:21:41<1:25:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7072/10070 [3:21:41<1:25:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7073/10070 [3:21:42<1:25:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7073/10070 [3:21:42<1:25:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7074/10070 [3:21:44<1:25:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7074/10070 [3:21:44<1:25:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7075/10070 [3:21:45<1:25:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7075/10070 [3:21:45<1:25:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7076/10070 [3:21:47<1:25:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7076/10070 [3:21:47<1:25:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7077/10070 [3:21:48<1:25:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7077/10070 [3:21:48<1:25:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7078/10070 [3:21:49<1:25:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7078/10070 [3:21:49<1:25:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7079/10070 [3:21:51<1:25:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7079/10070 [3:21:51<1:25:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7080/10070 [3:21:52<1:25:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7080/10070 [3:21:52<1:25:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7081/10070 [3:21:54<1:25:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7081/10070 [3:21:54<1:25:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7082/10070 [3:21:56<1:25:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7082/10070 [3:21:56<1:25:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7083/10070 [3:21:59<1:25:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7083/10070 [3:21:59<1:25:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7084/10070 [3:21:59<1:25:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7084/10070 [3:21:59<1:25:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7085/10070 [3:22:00<1:25:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7085/10070 [3:22:00<1:25:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7086/10070 [3:22:03<1:25:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7086/10070 [3:22:03<1:25:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7087/10070 [3:22:05<1:25:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7087/10070 [3:22:05<1:25:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7088/10070 [3:22:06<1:25:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7088/10070 [3:22:06<1:25:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7089/10070 [3:22:08<1:25:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7089/10070 [3:22:08<1:25:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7090/10070 [3:22:10<1:24:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7090/10070 [3:22:10<1:24:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7091/10070 [3:22:11<1:24:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7091/10070 [3:22:11<1:24:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7092/10070 [3:22:12<1:24:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7092/10070 [3:22:12<1:24:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7093/10070 [3:22:13<1:24:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7093/10070 [3:22:13<1:24:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7094/10070 [3:22:13<1:24:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7094/10070 [3:22:13<1:24:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7095/10070 [3:22:15<1:24:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7095/10070 [3:22:15<1:24:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7096/10070 [3:22:17<1:24:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7096/10070 [3:22:17<1:24:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7097/10070 [3:22:18<1:24:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7097/10070 [3:22:18<1:24:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7098/10070 [3:22:18<1:24:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7098/10070 [3:22:18<1:24:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  70%|▋| 7099/10070 [3:22:20<1:24:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  70%|▋| 7099/10070 [3:22:20<1:24:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7100/10070 [3:22:21<1:24:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7100/10070 [3:22:21<1:24:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7101/10070 [3:22:21<1:24:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7101/10070 [3:22:21<1:24:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7102/10070 [3:22:24<1:24:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7102/10070 [3:22:24<1:24:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7103/10070 [3:22:25<1:24:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7103/10070 [3:22:25<1:24:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7104/10070 [3:22:36<1:24:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7104/10070 [3:22:36<1:24:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7105/10070 [3:22:38<1:24:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7105/10070 [3:22:38<1:24:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7106/10070 [3:22:39<1:24:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7106/10070 [3:22:39<1:24:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7107/10070 [3:22:41<1:24:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7107/10070 [3:22:41<1:24:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7108/10070 [3:22:42<1:24:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7108/10070 [3:22:42<1:24:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7109/10070 [3:22:42<1:24:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7109/10070 [3:22:42<1:24:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7110/10070 [3:22:45<1:24:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7110/10070 [3:22:45<1:24:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7111/10070 [3:22:46<1:24:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7111/10070 [3:22:46<1:24:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7112/10070 [3:22:47<1:24:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7112/10070 [3:22:47<1:24:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7113/10070 [3:22:49<1:24:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7113/10070 [3:22:49<1:24:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7114/10070 [3:22:51<1:24:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7114/10070 [3:22:51<1:24:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7115/10070 [3:22:53<1:24:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7115/10070 [3:22:53<1:24:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7116/10070 [3:22:55<1:24:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7116/10070 [3:22:55<1:24:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7117/10070 [3:22:56<1:24:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7117/10070 [3:22:56<1:24:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7118/10070 [3:22:59<1:24:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7118/10070 [3:22:59<1:24:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7119/10070 [3:22:59<1:24:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7119/10070 [3:22:59<1:24:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7120/10070 [3:23:02<1:24:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7120/10070 [3:23:02<1:24:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7121/10070 [3:23:03<1:24:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7121/10070 [3:23:03<1:24:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7122/10070 [3:23:04<1:24:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7122/10070 [3:23:04<1:24:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7123/10070 [3:23:05<1:24:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7123/10070 [3:23:05<1:24:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7124/10070 [3:23:06<1:23:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7124/10070 [3:23:06<1:23:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7125/10070 [3:23:08<1:23:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7125/10070 [3:23:08<1:23:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7126/10070 [3:23:09<1:23:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7126/10070 [3:23:09<1:23:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7127/10070 [3:23:11<1:23:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7127/10070 [3:23:11<1:23:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7128/10070 [3:23:12<1:23:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7128/10070 [3:23:12<1:23:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7129/10070 [3:23:14<1:23:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7129/10070 [3:23:14<1:23:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7130/10070 [3:23:16<1:23:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7130/10070 [3:23:16<1:23:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7131/10070 [3:23:16<1:23:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7131/10070 [3:23:16<1:23:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7132/10070 [3:23:18<1:23:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7132/10070 [3:23:18<1:23:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7133/10070 [3:23:19<1:23:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7133/10070 [3:23:19<1:23:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7134/10070 [3:23:20<1:23:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7134/10070 [3:23:20<1:23:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7135/10070 [3:23:21<1:23:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7135/10070 [3:23:21<1:23:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7136/10070 [3:23:31<1:23:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7136/10070 [3:23:31<1:23:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7137/10070 [3:23:32<1:23:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7137/10070 [3:23:32<1:23:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7138/10070 [3:23:33<1:23:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7138/10070 [3:23:33<1:23:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7139/10070 [3:23:33<1:23:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7139/10070 [3:23:33<1:23:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7140/10070 [3:23:35<1:23:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7140/10070 [3:23:35<1:23:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7141/10070 [3:23:36<1:23:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7141/10070 [3:23:36<1:23:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7142/10070 [3:23:38<1:23:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7142/10070 [3:23:38<1:23:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7143/10070 [3:23:38<1:23:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7143/10070 [3:23:38<1:23:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7144/10070 [3:23:39<1:23:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7144/10070 [3:23:39<1:23:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7145/10070 [3:23:41<1:23:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7145/10070 [3:23:41<1:23:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7146/10070 [3:23:42<1:23:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7146/10070 [3:23:42<1:23:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7147/10070 [3:23:44<1:23:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7147/10070 [3:23:44<1:23:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7148/10070 [3:23:45<1:23:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7148/10070 [3:23:45<1:23:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7149/10070 [3:23:45<1:23:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7149/10070 [3:23:45<1:23:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7150/10070 [3:23:47<1:23:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7150/10070 [3:23:47<1:23:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7151/10070 [3:23:47<1:23:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7151/10070 [3:23:47<1:23:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7152/10070 [3:23:49<1:23:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7152/10070 [3:23:49<1:23:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7153/10070 [3:23:51<1:23:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7153/10070 [3:23:51<1:23:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7154/10070 [3:23:52<1:23:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7154/10070 [3:23:52<1:23:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7155/10070 [3:23:53<1:23:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7155/10070 [3:23:53<1:23:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7156/10070 [3:23:53<1:23:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7156/10070 [3:23:53<1:23:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7157/10070 [3:23:54<1:22:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7157/10070 [3:23:54<1:22:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7158/10070 [3:23:55<1:22:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7158/10070 [3:23:55<1:22:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7159/10070 [3:23:56<1:22:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7159/10070 [3:23:56<1:22:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7160/10070 [3:23:58<1:22:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7160/10070 [3:23:58<1:22:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7161/10070 [3:24:00<1:22:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7161/10070 [3:24:00<1:22:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7162/10070 [3:24:02<1:22:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7162/10070 [3:24:02<1:22:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7163/10070 [3:24:03<1:22:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7163/10070 [3:24:03<1:22:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7164/10070 [3:24:04<1:22:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7164/10070 [3:24:04<1:22:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7165/10070 [3:24:05<1:22:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7165/10070 [3:24:05<1:22:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7166/10070 [3:24:07<1:22:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7166/10070 [3:24:07<1:22:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7167/10070 [3:24:07<1:22:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7167/10070 [3:24:07<1:22:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7168/10070 [3:24:24<1:22:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7168/10070 [3:24:24<1:22:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7169/10070 [3:24:25<1:22:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7169/10070 [3:24:25<1:22:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7170/10070 [3:24:27<1:22:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7170/10070 [3:24:27<1:22:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7171/10070 [3:24:29<1:22:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7171/10070 [3:24:29<1:22:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7172/10070 [3:24:30<1:22:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7172/10070 [3:24:30<1:22:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7173/10070 [3:24:31<1:22:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7173/10070 [3:24:31<1:22:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7174/10070 [3:24:31<1:22:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7174/10070 [3:24:31<1:22:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7175/10070 [3:24:33<1:22:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7175/10070 [3:24:33<1:22:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7176/10070 [3:24:35<1:22:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7176/10070 [3:24:35<1:22:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7177/10070 [3:24:37<1:22:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7177/10070 [3:24:37<1:22:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7178/10070 [3:24:38<1:22:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7178/10070 [3:24:38<1:22:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7179/10070 [3:24:40<1:22:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7179/10070 [3:24:40<1:22:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7180/10070 [3:24:42<1:22:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7180/10070 [3:24:42<1:22:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7181/10070 [3:24:44<1:22:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7181/10070 [3:24:44<1:22:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7182/10070 [3:24:45<1:22:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7182/10070 [3:24:45<1:22:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7183/10070 [3:24:46<1:22:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7183/10070 [3:24:46<1:22:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7184/10070 [3:24:47<1:22:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7184/10070 [3:24:47<1:22:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7185/10070 [3:24:49<1:22:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7185/10070 [3:24:49<1:22:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7186/10070 [3:24:51<1:22:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7186/10070 [3:24:51<1:22:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7187/10070 [3:24:52<1:22:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7187/10070 [3:24:52<1:22:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7188/10070 [3:24:53<1:22:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7188/10070 [3:24:53<1:22:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7189/10070 [3:24:55<1:22:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7189/10070 [3:24:55<1:22:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7190/10070 [3:24:57<1:22:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7190/10070 [3:24:57<1:22:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7191/10070 [3:24:59<1:22:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7191/10070 [3:24:59<1:22:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7192/10070 [3:24:59<1:22:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7192/10070 [3:24:59<1:22:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7193/10070 [3:25:01<1:22:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7193/10070 [3:25:01<1:22:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7194/10070 [3:25:01<1:21:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7194/10070 [3:25:01<1:21:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7195/10070 [3:25:03<1:21:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7195/10070 [3:25:03<1:21:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7196/10070 [3:25:04<1:21:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7196/10070 [3:25:04<1:21:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7197/10070 [3:25:06<1:21:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7197/10070 [3:25:06<1:21:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7198/10070 [3:25:07<1:21:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7198/10070 [3:25:07<1:21:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7199/10070 [3:25:08<1:21:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7199/10070 [3:25:08<1:21:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  71%|▋| 7200/10070 [3:25:18<1:21:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  71%|▋| 7200/10070 [3:25:18<1:21:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7201/10070 [3:25:42<1:21:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7201/10070 [3:25:42<1:21:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7202/10070 [3:25:44<1:21:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7202/10070 [3:25:44<1:21:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7203/10070 [3:25:46<1:21:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7203/10070 [3:25:46<1:21:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7204/10070 [3:25:47<1:21:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7204/10070 [3:25:47<1:21:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7205/10070 [3:25:48<1:21:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7205/10070 [3:25:48<1:21:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7206/10070 [3:25:50<1:21:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7206/10070 [3:25:50<1:21:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7207/10070 [3:25:52<1:21:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7207/10070 [3:25:52<1:21:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7208/10070 [3:25:54<1:21:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7208/10070 [3:25:54<1:21:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7209/10070 [3:25:56<1:21:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7209/10070 [3:25:56<1:21:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7210/10070 [3:25:58<1:21:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7210/10070 [3:25:58<1:21:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7211/10070 [3:25:59<1:21:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7211/10070 [3:25:59<1:21:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7212/10070 [3:26:00<1:21:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7212/10070 [3:26:00<1:21:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7213/10070 [3:26:02<1:21:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7213/10070 [3:26:02<1:21:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7214/10070 [3:26:04<1:21:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7214/10070 [3:26:04<1:21:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7215/10070 [3:26:05<1:21:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7215/10070 [3:26:05<1:21:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7216/10070 [3:26:06<1:21:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7216/10070 [3:26:06<1:21:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7217/10070 [3:26:08<1:21:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7217/10070 [3:26:08<1:21:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7218/10070 [3:26:10<1:21:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7218/10070 [3:26:10<1:21:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7219/10070 [3:26:12<1:21:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7219/10070 [3:26:12<1:21:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7220/10070 [3:26:13<1:21:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7220/10070 [3:26:13<1:21:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7221/10070 [3:26:14<1:21:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7221/10070 [3:26:14<1:21:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7222/10070 [3:26:17<1:21:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7222/10070 [3:26:17<1:21:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7223/10070 [3:26:19<1:21:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7223/10070 [3:26:19<1:21:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7224/10070 [3:26:21<1:21:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7224/10070 [3:26:21<1:21:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7225/10070 [3:26:22<1:21:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7225/10070 [3:26:22<1:21:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7226/10070 [3:26:23<1:21:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7226/10070 [3:26:23<1:21:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7227/10070 [3:26:25<1:21:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7227/10070 [3:26:25<1:21:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7228/10070 [3:26:27<1:21:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7228/10070 [3:26:27<1:21:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7229/10070 [3:26:29<1:21:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7229/10070 [3:26:29<1:21:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7230/10070 [3:26:31<1:21:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7230/10070 [3:26:31<1:21:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7231/10070 [3:26:33<1:21:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7231/10070 [3:26:33<1:21:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7232/10070 [3:26:41<1:21:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7232/10070 [3:26:41<1:21:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7233/10070 [3:26:42<1:21:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7233/10070 [3:26:42<1:21:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7234/10070 [3:26:43<1:21:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7234/10070 [3:26:43<1:21:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7235/10070 [3:26:44<1:21:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7235/10070 [3:26:44<1:21:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7236/10070 [3:26:44<1:20:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7236/10070 [3:26:44<1:20:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7237/10070 [3:26:45<1:20:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7237/10070 [3:26:45<1:20:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7238/10070 [3:26:46<1:20:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7238/10070 [3:26:46<1:20:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7239/10070 [3:26:48<1:20:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7239/10070 [3:26:48<1:20:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7240/10070 [3:26:49<1:20:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7240/10070 [3:26:49<1:20:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7241/10070 [3:26:51<1:20:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7241/10070 [3:26:51<1:20:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7242/10070 [3:26:52<1:20:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7242/10070 [3:26:52<1:20:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7243/10070 [3:26:54<1:20:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7243/10070 [3:26:54<1:20:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7244/10070 [3:26:55<1:20:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7244/10070 [3:26:55<1:20:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7245/10070 [3:26:57<1:20:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7245/10070 [3:26:57<1:20:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7246/10070 [3:26:58<1:20:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7246/10070 [3:26:58<1:20:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7247/10070 [3:26:59<1:20:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7247/10070 [3:26:59<1:20:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7248/10070 [3:27:00<1:20:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7248/10070 [3:27:00<1:20:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7249/10070 [3:27:02<1:20:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7249/10070 [3:27:02<1:20:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7250/10070 [3:27:04<1:20:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7250/10070 [3:27:04<1:20:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7251/10070 [3:27:06<1:20:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7251/10070 [3:27:06<1:20:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7252/10070 [3:27:07<1:20:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7252/10070 [3:27:07<1:20:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7253/10070 [3:27:09<1:20:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7253/10070 [3:27:09<1:20:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7254/10070 [3:27:09<1:20:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7254/10070 [3:27:09<1:20:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7255/10070 [3:27:10<1:20:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7255/10070 [3:27:10<1:20:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7256/10070 [3:27:12<1:20:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7256/10070 [3:27:12<1:20:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7257/10070 [3:27:12<1:20:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7257/10070 [3:27:12<1:20:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7258/10070 [3:27:13<1:20:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7258/10070 [3:27:13<1:20:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7259/10070 [3:27:14<1:20:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7259/10070 [3:27:14<1:20:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7260/10070 [3:27:15<1:20:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7260/10070 [3:27:15<1:20:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7261/10070 [3:27:16<1:20:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7261/10070 [3:27:16<1:20:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7262/10070 [3:27:17<1:20:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7262/10070 [3:27:17<1:20:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7263/10070 [3:27:18<1:20:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7263/10070 [3:27:18<1:20:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7264/10070 [3:27:36<1:20:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7264/10070 [3:27:36<1:20:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7265/10070 [3:27:38<1:20:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7265/10070 [3:27:38<1:20:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7266/10070 [3:27:39<1:20:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7266/10070 [3:27:39<1:20:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7267/10070 [3:27:40<1:20:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7267/10070 [3:27:40<1:20:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7268/10070 [3:27:41<1:20:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7268/10070 [3:27:41<1:20:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7269/10070 [3:27:42<1:20:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7269/10070 [3:27:42<1:20:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7270/10070 [3:27:44<1:20:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7270/10070 [3:27:44<1:20:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7271/10070 [3:27:47<1:19:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7271/10070 [3:27:47<1:19:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7272/10070 [3:27:47<1:19:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7272/10070 [3:27:47<1:19:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7273/10070 [3:27:50<1:19:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7273/10070 [3:27:50<1:19:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7274/10070 [3:27:51<1:19:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7274/10070 [3:27:51<1:19:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7275/10070 [3:27:51<1:19:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7275/10070 [3:27:51<1:19:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7276/10070 [3:27:52<1:19:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7276/10070 [3:27:52<1:19:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7277/10070 [3:27:53<1:19:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7277/10070 [3:27:53<1:19:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7278/10070 [3:27:56<1:19:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7278/10070 [3:27:56<1:19:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7279/10070 [3:27:56<1:19:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7279/10070 [3:27:56<1:19:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7280/10070 [3:27:59<1:19:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7280/10070 [3:27:59<1:19:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7281/10070 [3:28:00<1:19:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7281/10070 [3:28:00<1:19:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7282/10070 [3:28:01<1:19:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7282/10070 [3:28:01<1:19:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7283/10070 [3:28:03<1:19:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7283/10070 [3:28:03<1:19:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7284/10070 [3:28:05<1:19:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7284/10070 [3:28:05<1:19:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7285/10070 [3:28:06<1:19:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7285/10070 [3:28:06<1:19:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7286/10070 [3:28:07<1:19:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7286/10070 [3:28:07<1:19:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7287/10070 [3:28:08<1:19:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7287/10070 [3:28:08<1:19:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7288/10070 [3:28:09<1:19:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7288/10070 [3:28:09<1:19:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7289/10070 [3:28:11<1:19:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7289/10070 [3:28:11<1:19:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7290/10070 [3:28:12<1:19:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7290/10070 [3:28:12<1:19:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7291/10070 [3:28:14<1:19:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7291/10070 [3:28:14<1:19:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7292/10070 [3:28:14<1:19:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7292/10070 [3:28:14<1:19:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7293/10070 [3:28:17<1:19:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7293/10070 [3:28:17<1:19:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7294/10070 [3:28:18<1:19:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7294/10070 [3:28:18<1:19:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7295/10070 [3:28:19<1:19:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7295/10070 [3:28:19<1:19:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7296/10070 [3:28:27<1:19:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7296/10070 [3:28:27<1:19:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7297/10070 [3:28:28<1:19:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7297/10070 [3:28:28<1:19:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7298/10070 [3:28:29<1:19:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7298/10070 [3:28:29<1:19:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7299/10070 [3:28:30<1:19:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7299/10070 [3:28:30<1:19:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  72%|▋| 7300/10070 [3:28:31<1:19:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  72%|▋| 7300/10070 [3:28:31<1:19:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7301/10070 [3:28:33<1:19:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7301/10070 [3:28:33<1:19:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7302/10070 [3:28:34<1:19:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7302/10070 [3:28:34<1:19:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7303/10070 [3:28:36<1:19:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7303/10070 [3:28:36<1:19:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7304/10070 [3:28:38<1:19:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7304/10070 [3:28:38<1:19:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7305/10070 [3:28:39<1:18:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7305/10070 [3:28:39<1:18:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7306/10070 [3:28:40<1:18:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7306/10070 [3:28:40<1:18:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7307/10070 [3:28:42<1:18:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7307/10070 [3:28:42<1:18:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7308/10070 [3:28:43<1:18:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7308/10070 [3:28:43<1:18:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7309/10070 [3:28:45<1:18:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7309/10070 [3:28:45<1:18:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7310/10070 [3:28:47<1:18:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7310/10070 [3:28:47<1:18:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7311/10070 [3:28:49<1:18:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7311/10070 [3:28:49<1:18:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7312/10070 [3:28:51<1:18:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7312/10070 [3:28:51<1:18:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7313/10070 [3:28:52<1:18:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7313/10070 [3:28:52<1:18:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7314/10070 [3:28:53<1:18:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7314/10070 [3:28:53<1:18:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7315/10070 [3:28:53<1:18:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7315/10070 [3:28:53<1:18:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7316/10070 [3:28:54<1:18:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7316/10070 [3:28:54<1:18:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7317/10070 [3:28:56<1:18:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7317/10070 [3:28:56<1:18:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7318/10070 [3:28:56<1:18:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7318/10070 [3:28:56<1:18:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7319/10070 [3:28:58<1:18:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7319/10070 [3:28:58<1:18:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7320/10070 [3:29:00<1:18:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7320/10070 [3:29:00<1:18:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7321/10070 [3:29:01<1:18:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7321/10070 [3:29:01<1:18:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7322/10070 [3:29:03<1:18:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7322/10070 [3:29:03<1:18:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7323/10070 [3:29:04<1:18:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7323/10070 [3:29:04<1:18:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7324/10070 [3:29:05<1:18:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7324/10070 [3:29:05<1:18:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7325/10070 [3:29:06<1:18:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7325/10070 [3:29:06<1:18:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7326/10070 [3:29:08<1:18:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7326/10070 [3:29:08<1:18:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7327/10070 [3:29:10<1:18:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7327/10070 [3:29:10<1:18:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7328/10070 [3:29:19<1:18:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7328/10070 [3:29:19<1:18:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7329/10070 [3:29:21<1:18:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7329/10070 [3:29:21<1:18:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7330/10070 [3:29:22<1:18:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7330/10070 [3:29:22<1:18:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7331/10070 [3:29:23<1:18:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7331/10070 [3:29:23<1:18:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7332/10070 [3:29:24<1:18:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7332/10070 [3:29:24<1:18:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7333/10070 [3:29:26<1:18:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7333/10070 [3:29:26<1:18:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7334/10070 [3:29:27<1:18:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7334/10070 [3:29:27<1:18:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7335/10070 [3:29:29<1:18:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7335/10070 [3:29:29<1:18:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7336/10070 [3:29:30<1:18:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7336/10070 [3:29:30<1:18:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7337/10070 [3:29:32<1:18:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7337/10070 [3:29:32<1:18:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7338/10070 [3:29:33<1:18:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7338/10070 [3:29:33<1:18:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7339/10070 [3:29:34<1:17:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7339/10070 [3:29:34<1:17:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7340/10070 [3:29:36<1:17:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7340/10070 [3:29:36<1:17:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7341/10070 [3:29:38<1:17:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7341/10070 [3:29:38<1:17:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7342/10070 [3:29:40<1:17:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7342/10070 [3:29:40<1:17:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7343/10070 [3:29:42<1:17:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7343/10070 [3:29:42<1:17:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7344/10070 [3:29:43<1:17:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7344/10070 [3:29:43<1:17:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7345/10070 [3:29:44<1:17:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7345/10070 [3:29:44<1:17:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7346/10070 [3:29:46<1:17:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7346/10070 [3:29:46<1:17:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7347/10070 [3:29:46<1:17:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7347/10070 [3:29:46<1:17:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7348/10070 [3:29:48<1:17:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7348/10070 [3:29:48<1:17:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7349/10070 [3:29:50<1:17:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7349/10070 [3:29:50<1:17:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7350/10070 [3:29:52<1:17:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7350/10070 [3:29:52<1:17:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7351/10070 [3:29:53<1:17:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7351/10070 [3:29:53<1:17:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7352/10070 [3:29:56<1:17:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7352/10070 [3:29:56<1:17:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7353/10070 [3:29:58<1:17:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7353/10070 [3:29:58<1:17:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7354/10070 [3:30:00<1:17:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7354/10070 [3:30:00<1:17:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7355/10070 [3:30:01<1:17:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7355/10070 [3:30:01<1:17:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7356/10070 [3:30:02<1:17:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7356/10070 [3:30:02<1:17:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7357/10070 [3:30:03<1:17:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7357/10070 [3:30:03<1:17:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7358/10070 [3:30:05<1:17:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7358/10070 [3:30:05<1:17:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7359/10070 [3:30:06<1:17:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7359/10070 [3:30:06<1:17:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7360/10070 [3:30:14<1:17:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7360/10070 [3:30:14<1:17:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7361/10070 [3:30:15<1:17:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7361/10070 [3:30:15<1:17:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7362/10070 [3:30:16<1:17:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7362/10070 [3:30:16<1:17:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7363/10070 [3:30:17<1:17:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7363/10070 [3:30:17<1:17:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7364/10070 [3:30:19<1:17:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7364/10070 [3:30:19<1:17:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7365/10070 [3:30:21<1:17:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7365/10070 [3:30:21<1:17:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7366/10070 [3:30:22<1:17:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7366/10070 [3:30:22<1:17:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7367/10070 [3:30:24<1:17:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7367/10070 [3:30:24<1:17:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7368/10070 [3:30:25<1:17:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7368/10070 [3:30:25<1:17:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7369/10070 [3:30:27<1:17:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7369/10070 [3:30:27<1:17:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7370/10070 [3:30:28<1:17:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7370/10070 [3:30:28<1:17:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7371/10070 [3:30:29<1:17:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7371/10070 [3:30:29<1:17:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7372/10070 [3:30:31<1:17:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7372/10070 [3:30:31<1:17:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7373/10070 [3:30:31<1:17:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7373/10070 [3:30:31<1:17:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7374/10070 [3:30:33<1:16:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7374/10070 [3:30:33<1:16:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7375/10070 [3:30:35<1:16:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7375/10070 [3:30:35<1:16:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7376/10070 [3:30:36<1:16:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7376/10070 [3:30:36<1:16:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7377/10070 [3:30:38<1:16:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7377/10070 [3:30:38<1:16:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7378/10070 [3:30:38<1:16:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7378/10070 [3:30:38<1:16:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7379/10070 [3:30:41<1:16:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7379/10070 [3:30:41<1:16:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7380/10070 [3:30:42<1:16:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7380/10070 [3:30:42<1:16:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7381/10070 [3:30:43<1:16:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7381/10070 [3:30:43<1:16:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7382/10070 [3:30:44<1:16:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7382/10070 [3:30:44<1:16:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7383/10070 [3:30:46<1:16:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7383/10070 [3:30:46<1:16:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7384/10070 [3:30:47<1:16:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7384/10070 [3:30:47<1:16:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7385/10070 [3:30:49<1:16:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7385/10070 [3:30:49<1:16:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7386/10070 [3:30:50<1:16:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7386/10070 [3:30:50<1:16:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7387/10070 [3:30:51<1:16:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7387/10070 [3:30:51<1:16:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7388/10070 [3:30:52<1:16:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7388/10070 [3:30:52<1:16:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7389/10070 [3:30:53<1:16:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7389/10070 [3:30:53<1:16:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7390/10070 [3:30:54<1:16:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7390/10070 [3:30:54<1:16:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7391/10070 [3:30:55<1:16:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7391/10070 [3:30:55<1:16:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7392/10070 [3:31:08<1:16:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7392/10070 [3:31:08<1:16:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7393/10070 [3:31:09<1:16:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7393/10070 [3:31:09<1:16:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7394/10070 [3:31:10<1:16:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7394/10070 [3:31:10<1:16:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7395/10070 [3:31:12<1:16:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7395/10070 [3:31:12<1:16:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7396/10070 [3:31:12<1:16:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7396/10070 [3:31:12<1:16:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7397/10070 [3:31:13<1:16:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7397/10070 [3:31:13<1:16:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7398/10070 [3:31:15<1:16:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7398/10070 [3:31:15<1:16:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7399/10070 [3:31:17<1:16:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7399/10070 [3:31:17<1:16:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7400/10070 [3:31:19<1:16:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7400/10070 [3:31:19<1:16:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  73%|▋| 7401/10070 [3:31:21<1:16:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  73%|▋| 7401/10070 [3:31:21<1:16:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7402/10070 [3:31:22<1:16:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7402/10070 [3:31:22<1:16:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7403/10070 [3:31:24<1:16:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7403/10070 [3:31:24<1:16:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7404/10070 [3:31:25<1:16:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7404/10070 [3:31:25<1:16:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7405/10070 [3:31:27<1:16:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7405/10070 [3:31:27<1:16:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7406/10070 [3:31:28<1:16:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7406/10070 [3:31:28<1:16:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7407/10070 [3:31:31<1:16:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7407/10070 [3:31:31<1:16:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7408/10070 [3:31:32<1:16:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7408/10070 [3:31:32<1:16:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7409/10070 [3:31:34<1:15:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7409/10070 [3:31:34<1:15:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7410/10070 [3:31:35<1:15:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7410/10070 [3:31:35<1:15:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7411/10070 [3:31:37<1:15:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7411/10070 [3:31:37<1:15:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7412/10070 [3:31:39<1:15:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7412/10070 [3:31:39<1:15:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7413/10070 [3:31:41<1:15:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7413/10070 [3:31:41<1:15:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7414/10070 [3:31:42<1:15:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7414/10070 [3:31:42<1:15:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7415/10070 [3:31:44<1:15:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7415/10070 [3:31:44<1:15:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7416/10070 [3:31:46<1:15:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7416/10070 [3:31:46<1:15:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7417/10070 [3:31:48<1:15:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7417/10070 [3:31:48<1:15:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7418/10070 [3:31:49<1:15:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7418/10070 [3:31:49<1:15:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7419/10070 [3:31:49<1:15:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7419/10070 [3:31:49<1:15:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7420/10070 [3:31:50<1:15:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7420/10070 [3:31:50<1:15:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7421/10070 [3:31:51<1:15:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7421/10070 [3:31:51<1:15:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7422/10070 [3:31:54<1:15:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7422/10070 [3:31:54<1:15:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7423/10070 [3:31:54<1:15:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7423/10070 [3:31:54<1:15:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7424/10070 [3:32:06<1:15:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7424/10070 [3:32:06<1:15:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7425/10070 [3:32:08<1:15:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7425/10070 [3:32:08<1:15:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7426/10070 [3:32:09<1:15:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7426/10070 [3:32:09<1:15:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7427/10070 [3:32:11<1:15:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7427/10070 [3:32:11<1:15:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7428/10070 [3:32:12<1:15:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7428/10070 [3:32:12<1:15:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7429/10070 [3:32:12<1:15:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7429/10070 [3:32:12<1:15:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7430/10070 [3:32:14<1:15:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7430/10070 [3:32:14<1:15:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7431/10070 [3:32:15<1:15:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7431/10070 [3:32:15<1:15:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7432/10070 [3:32:16<1:15:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7432/10070 [3:32:16<1:15:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7433/10070 [3:32:18<1:15:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7433/10070 [3:32:18<1:15:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7434/10070 [3:32:19<1:15:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7434/10070 [3:32:19<1:15:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7435/10070 [3:32:20<1:15:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7435/10070 [3:32:20<1:15:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7436/10070 [3:32:22<1:15:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7436/10070 [3:32:22<1:15:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7437/10070 [3:32:23<1:15:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7437/10070 [3:32:23<1:15:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7438/10070 [3:32:25<1:15:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7438/10070 [3:32:25<1:15:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7439/10070 [3:32:27<1:15:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7439/10070 [3:32:27<1:15:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7440/10070 [3:32:28<1:15:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7440/10070 [3:32:28<1:15:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7441/10070 [3:32:29<1:15:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7441/10070 [3:32:29<1:15:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7442/10070 [3:32:29<1:15:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7442/10070 [3:32:29<1:15:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7443/10070 [3:32:31<1:15:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7443/10070 [3:32:31<1:15:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7444/10070 [3:32:33<1:14:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7444/10070 [3:32:33<1:14:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7445/10070 [3:32:34<1:14:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7445/10070 [3:32:34<1:14:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7446/10070 [3:32:36<1:14:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7446/10070 [3:32:36<1:14:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7447/10070 [3:32:37<1:14:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7447/10070 [3:32:37<1:14:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7448/10070 [3:32:38<1:14:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7448/10070 [3:32:38<1:14:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7449/10070 [3:32:39<1:14:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7449/10070 [3:32:39<1:14:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7450/10070 [3:32:42<1:14:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7450/10070 [3:32:42<1:14:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7451/10070 [3:32:44<1:14:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7451/10070 [3:32:44<1:14:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7452/10070 [3:32:46<1:14:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7452/10070 [3:32:46<1:14:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7453/10070 [3:32:47<1:14:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7453/10070 [3:32:47<1:14:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7454/10070 [3:32:49<1:14:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7454/10070 [3:32:49<1:14:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7455/10070 [3:32:49<1:14:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7455/10070 [3:32:49<1:14:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7456/10070 [3:32:57<1:14:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7456/10070 [3:32:57<1:14:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7457/10070 [3:32:58<1:14:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7457/10070 [3:32:58<1:14:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7458/10070 [3:33:00<1:14:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7458/10070 [3:33:00<1:14:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7459/10070 [3:33:02<1:14:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7459/10070 [3:33:02<1:14:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7460/10070 [3:33:04<1:14:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7460/10070 [3:33:04<1:14:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7461/10070 [3:33:06<1:14:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7461/10070 [3:33:06<1:14:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7462/10070 [3:33:07<1:14:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7462/10070 [3:33:07<1:14:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7463/10070 [3:33:08<1:14:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7463/10070 [3:33:08<1:14:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7464/10070 [3:33:10<1:14:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7464/10070 [3:33:10<1:14:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7465/10070 [3:33:11<1:14:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7465/10070 [3:33:11<1:14:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7466/10070 [3:33:12<1:14:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7466/10070 [3:33:12<1:14:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7467/10070 [3:33:14<1:14:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7467/10070 [3:33:14<1:14:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7468/10070 [3:33:15<1:14:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7468/10070 [3:33:15<1:14:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7469/10070 [3:33:16<1:14:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7469/10070 [3:33:16<1:14:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7470/10070 [3:33:18<1:14:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7470/10070 [3:33:18<1:14:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7471/10070 [3:33:18<1:14:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7471/10070 [3:33:18<1:14:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7472/10070 [3:33:20<1:14:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7472/10070 [3:33:20<1:14:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7473/10070 [3:33:21<1:14:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7473/10070 [3:33:21<1:14:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7474/10070 [3:33:22<1:14:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7474/10070 [3:33:22<1:14:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7475/10070 [3:33:24<1:14:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7475/10070 [3:33:24<1:14:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7476/10070 [3:33:25<1:14:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7476/10070 [3:33:25<1:14:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7477/10070 [3:33:28<1:14:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7477/10070 [3:33:28<1:14:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7478/10070 [3:33:29<1:14:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7478/10070 [3:33:29<1:14:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7479/10070 [3:33:30<1:13:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7479/10070 [3:33:30<1:13:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7480/10070 [3:33:31<1:13:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7480/10070 [3:33:31<1:13:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7481/10070 [3:33:31<1:13:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7481/10070 [3:33:31<1:13:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7482/10070 [3:33:33<1:13:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7482/10070 [3:33:33<1:13:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7483/10070 [3:33:34<1:13:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7483/10070 [3:33:34<1:13:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7484/10070 [3:33:35<1:13:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7484/10070 [3:33:35<1:13:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7485/10070 [3:33:37<1:13:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7485/10070 [3:33:37<1:13:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7486/10070 [3:33:38<1:13:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7486/10070 [3:33:38<1:13:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7487/10070 [3:33:39<1:13:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7487/10070 [3:33:39<1:13:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7488/10070 [3:33:50<1:13:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7488/10070 [3:33:50<1:13:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7489/10070 [3:33:51<1:13:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7489/10070 [3:33:51<1:13:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7490/10070 [3:33:53<1:13:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7490/10070 [3:33:53<1:13:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7491/10070 [3:33:53<1:13:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7491/10070 [3:33:53<1:13:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7492/10070 [3:33:54<1:13:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7492/10070 [3:33:54<1:13:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7493/10070 [3:33:55<1:13:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7493/10070 [3:33:55<1:13:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7494/10070 [3:33:56<1:13:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7494/10070 [3:33:56<1:13:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7495/10070 [3:33:58<1:13:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7495/10070 [3:33:58<1:13:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7496/10070 [3:34:00<1:13:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7496/10070 [3:34:00<1:13:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7497/10070 [3:34:00<1:13:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7497/10070 [3:34:00<1:13:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7498/10070 [3:34:02<1:13:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7498/10070 [3:34:02<1:13:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7499/10070 [3:34:04<1:13:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7499/10070 [3:34:04<1:13:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7500/10070 [3:34:06<1:13:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7500/10070 [3:34:06<1:13:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7501/10070 [3:34:08<1:13:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7501/10070 [3:34:08<1:13:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  74%|▋| 7502/10070 [3:34:08<1:13:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  74%|▋| 7502/10070 [3:34:08<1:13:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7503/10070 [3:34:10<1:13:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7503/10070 [3:34:10<1:13:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7504/10070 [3:34:11<1:13:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7504/10070 [3:34:11<1:13:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7505/10070 [3:34:14<1:13:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7505/10070 [3:34:14<1:13:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7506/10070 [3:34:16<1:13:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7506/10070 [3:34:16<1:13:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7507/10070 [3:34:17<1:13:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7507/10070 [3:34:17<1:13:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7508/10070 [3:34:19<1:13:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7508/10070 [3:34:19<1:13:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7509/10070 [3:34:21<1:13:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7509/10070 [3:34:21<1:13:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7510/10070 [3:34:23<1:13:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7510/10070 [3:34:23<1:13:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7511/10070 [3:34:25<1:13:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7511/10070 [3:34:25<1:13:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7512/10070 [3:34:27<1:13:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7512/10070 [3:34:27<1:13:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7513/10070 [3:34:29<1:13:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7513/10070 [3:34:29<1:13:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7514/10070 [3:34:30<1:12:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7514/10070 [3:34:30<1:12:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7515/10070 [3:34:30<1:12:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7515/10070 [3:34:30<1:12:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7516/10070 [3:34:31<1:12:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7516/10070 [3:34:31<1:12:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7517/10070 [3:34:33<1:12:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7517/10070 [3:34:33<1:12:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7518/10070 [3:34:34<1:12:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7518/10070 [3:34:34<1:12:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7519/10070 [3:34:35<1:12:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7519/10070 [3:34:35<1:12:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7520/10070 [3:34:42<1:12:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7520/10070 [3:34:42<1:12:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7521/10070 [3:34:43<1:12:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7521/10070 [3:34:43<1:12:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7522/10070 [3:34:45<1:12:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7522/10070 [3:34:45<1:12:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7523/10070 [3:34:46<1:12:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7523/10070 [3:34:46<1:12:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7524/10070 [3:34:47<1:12:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7524/10070 [3:34:47<1:12:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7525/10070 [3:34:48<1:12:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7525/10070 [3:34:48<1:12:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7526/10070 [3:34:50<1:12:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7526/10070 [3:34:50<1:12:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7527/10070 [3:34:53<1:12:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7527/10070 [3:34:53<1:12:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7528/10070 [3:34:55<1:12:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7528/10070 [3:34:55<1:12:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7529/10070 [3:34:57<1:12:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7529/10070 [3:34:57<1:12:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7530/10070 [3:34:59<1:12:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7530/10070 [3:34:59<1:12:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7531/10070 [3:35:01<1:12:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7531/10070 [3:35:01<1:12:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7532/10070 [3:35:02<1:12:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7532/10070 [3:35:02<1:12:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7533/10070 [3:35:04<1:12:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7533/10070 [3:35:04<1:12:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7534/10070 [3:35:05<1:12:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7534/10070 [3:35:05<1:12:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7535/10070 [3:35:07<1:12:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7535/10070 [3:35:07<1:12:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7536/10070 [3:35:08<1:12:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7536/10070 [3:35:08<1:12:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7537/10070 [3:35:09<1:12:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7537/10070 [3:35:09<1:12:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7538/10070 [3:35:10<1:12:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7538/10070 [3:35:10<1:12:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7539/10070 [3:35:13<1:12:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7539/10070 [3:35:13<1:12:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7540/10070 [3:35:13<1:12:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7540/10070 [3:35:13<1:12:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7541/10070 [3:35:14<1:12:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7541/10070 [3:35:14<1:12:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7542/10070 [3:35:15<1:12:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7542/10070 [3:35:15<1:12:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7543/10070 [3:35:18<1:12:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7543/10070 [3:35:18<1:12:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7544/10070 [3:35:19<1:12:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7544/10070 [3:35:19<1:12:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7545/10070 [3:35:21<1:12:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7545/10070 [3:35:21<1:12:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7546/10070 [3:35:23<1:12:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7546/10070 [3:35:23<1:12:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7547/10070 [3:35:24<1:12:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7547/10070 [3:35:24<1:12:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7548/10070 [3:35:25<1:11:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7548/10070 [3:35:25<1:11:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7549/10070 [3:35:28<1:11:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7549/10070 [3:35:28<1:11:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7550/10070 [3:35:29<1:11:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7550/10070 [3:35:29<1:11:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7551/10070 [3:35:29<1:11:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7551/10070 [3:35:29<1:11:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▋| 7552/10070 [3:35:36<1:11:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▋| 7552/10070 [3:35:36<1:11:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7553/10070 [3:35:38<1:11:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7553/10070 [3:35:38<1:11:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7554/10070 [3:35:38<1:11:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7554/10070 [3:35:38<1:11:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7555/10070 [3:35:39<1:11:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7555/10070 [3:35:39<1:11:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7556/10070 [3:35:42<1:11:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7556/10070 [3:35:42<1:11:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7557/10070 [3:35:44<1:11:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7557/10070 [3:35:44<1:11:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7558/10070 [3:35:45<1:11:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7558/10070 [3:35:45<1:11:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7559/10070 [3:35:46<1:11:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7559/10070 [3:35:46<1:11:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7560/10070 [3:35:48<1:11:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7560/10070 [3:35:48<1:11:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7561/10070 [3:35:49<1:11:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7561/10070 [3:35:49<1:11:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7562/10070 [3:35:50<1:11:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7562/10070 [3:35:50<1:11:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7563/10070 [3:35:51<1:11:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7563/10070 [3:35:51<1:11:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7564/10070 [3:35:53<1:11:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7564/10070 [3:35:53<1:11:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7565/10070 [3:35:55<1:11:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7565/10070 [3:35:55<1:11:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7566/10070 [3:35:55<1:11:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7566/10070 [3:35:55<1:11:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7567/10070 [3:35:56<1:11:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7567/10070 [3:35:56<1:11:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7568/10070 [3:35:57<1:11:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7568/10070 [3:35:57<1:11:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7569/10070 [3:35:58<1:11:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7569/10070 [3:35:58<1:11:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7570/10070 [3:36:00<1:11:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7570/10070 [3:36:00<1:11:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7571/10070 [3:36:01<1:11:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7571/10070 [3:36:01<1:11:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7572/10070 [3:36:02<1:11:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7572/10070 [3:36:02<1:11:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7573/10070 [3:36:03<1:11:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7573/10070 [3:36:03<1:11:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7574/10070 [3:36:05<1:11:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7574/10070 [3:36:05<1:11:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7575/10070 [3:36:06<1:11:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7575/10070 [3:36:06<1:11:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7576/10070 [3:36:07<1:11:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7576/10070 [3:36:07<1:11:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7577/10070 [3:36:09<1:11:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7577/10070 [3:36:09<1:11:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7578/10070 [3:36:10<1:11:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7578/10070 [3:36:10<1:11:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7579/10070 [3:36:12<1:11:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7579/10070 [3:36:12<1:11:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7580/10070 [3:36:14<1:11:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7580/10070 [3:36:14<1:11:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7581/10070 [3:36:15<1:11:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7581/10070 [3:36:15<1:11:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7582/10070 [3:36:16<1:10:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7582/10070 [3:36:16<1:10:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7583/10070 [3:36:17<1:10:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7583/10070 [3:36:17<1:10:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7584/10070 [3:36:33<1:10:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7584/10070 [3:36:33<1:10:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7585/10070 [3:36:33<1:10:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7585/10070 [3:36:33<1:10:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7586/10070 [3:36:34<1:10:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7586/10070 [3:36:34<1:10:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7587/10070 [3:36:35<1:10:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7587/10070 [3:36:35<1:10:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7588/10070 [3:36:36<1:10:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7588/10070 [3:36:36<1:10:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7589/10070 [3:36:36<1:10:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7589/10070 [3:36:36<1:10:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7590/10070 [3:36:39<1:10:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7590/10070 [3:36:39<1:10:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7591/10070 [3:36:40<1:10:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7591/10070 [3:36:40<1:10:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7592/10070 [3:36:41<1:10:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7592/10070 [3:36:41<1:10:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7593/10070 [3:36:42<1:10:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7593/10070 [3:36:42<1:10:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7594/10070 [3:36:43<1:10:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7594/10070 [3:36:43<1:10:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7595/10070 [3:36:44<1:10:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7595/10070 [3:36:44<1:10:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7596/10070 [3:36:46<1:10:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7596/10070 [3:36:46<1:10:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7597/10070 [3:36:47<1:10:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7597/10070 [3:36:47<1:10:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7598/10070 [3:36:47<1:10:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7598/10070 [3:36:47<1:10:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7599/10070 [3:36:50<1:10:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7599/10070 [3:36:50<1:10:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7600/10070 [3:36:51<1:10:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7600/10070 [3:36:51<1:10:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7601/10070 [3:36:52<1:10:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7601/10070 [3:36:52<1:10:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  75%|▊| 7602/10070 [3:36:53<1:10:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  75%|▊| 7602/10070 [3:36:53<1:10:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7603/10070 [3:36:54<1:10:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7603/10070 [3:36:54<1:10:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7604/10070 [3:36:55<1:10:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7604/10070 [3:36:55<1:10:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7605/10070 [3:36:56<1:10:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7605/10070 [3:36:56<1:10:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7606/10070 [3:36:57<1:10:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7606/10070 [3:36:57<1:10:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7607/10070 [3:36:59<1:10:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7607/10070 [3:36:59<1:10:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7608/10070 [3:36:59<1:10:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7608/10070 [3:36:59<1:10:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7609/10070 [3:37:01<1:10:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7609/10070 [3:37:01<1:10:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7610/10070 [3:37:02<1:10:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7610/10070 [3:37:02<1:10:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7611/10070 [3:37:05<1:10:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7611/10070 [3:37:05<1:10:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7612/10070 [3:37:06<1:10:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7612/10070 [3:37:06<1:10:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7613/10070 [3:37:07<1:10:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7613/10070 [3:37:07<1:10:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7614/10070 [3:37:08<1:10:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7614/10070 [3:37:08<1:10:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7615/10070 [3:37:09<1:10:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7615/10070 [3:37:09<1:10:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7616/10070 [3:37:24<1:10:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7616/10070 [3:37:24<1:10:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7617/10070 [3:37:25<1:10:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7617/10070 [3:37:25<1:10:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7618/10070 [3:37:26<1:09:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7618/10070 [3:37:26<1:09:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7619/10070 [3:37:27<1:09:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7619/10070 [3:37:27<1:09:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7620/10070 [3:37:29<1:09:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7620/10070 [3:37:29<1:09:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7621/10070 [3:37:31<1:09:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7621/10070 [3:37:31<1:09:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7622/10070 [3:37:33<1:09:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7622/10070 [3:37:33<1:09:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7623/10070 [3:37:34<1:09:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7623/10070 [3:37:34<1:09:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7624/10070 [3:37:35<1:09:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7624/10070 [3:37:35<1:09:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7625/10070 [3:37:36<1:09:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7625/10070 [3:37:36<1:09:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7626/10070 [3:37:37<1:09:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7626/10070 [3:37:37<1:09:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7627/10070 [3:37:39<1:09:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7627/10070 [3:37:39<1:09:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7628/10070 [3:37:40<1:09:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7628/10070 [3:37:40<1:09:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7629/10070 [3:37:41<1:09:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7629/10070 [3:37:41<1:09:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7630/10070 [3:37:41<1:09:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7630/10070 [3:37:41<1:09:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7631/10070 [3:37:44<1:09:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7631/10070 [3:37:44<1:09:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7632/10070 [3:37:45<1:09:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7632/10070 [3:37:45<1:09:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7633/10070 [3:37:46<1:09:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7633/10070 [3:37:46<1:09:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7634/10070 [3:37:47<1:09:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7634/10070 [3:37:47<1:09:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7635/10070 [3:37:48<1:09:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7635/10070 [3:37:48<1:09:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7636/10070 [3:37:50<1:09:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7636/10070 [3:37:50<1:09:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7637/10070 [3:37:52<1:09:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7637/10070 [3:37:52<1:09:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7638/10070 [3:37:53<1:09:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7638/10070 [3:37:53<1:09:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7639/10070 [3:37:55<1:09:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7639/10070 [3:37:55<1:09:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7640/10070 [3:37:55<1:09:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7640/10070 [3:37:55<1:09:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7641/10070 [3:37:58<1:09:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7641/10070 [3:37:58<1:09:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7642/10070 [3:37:59<1:09:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7642/10070 [3:37:59<1:09:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7643/10070 [3:38:01<1:09:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7643/10070 [3:38:01<1:09:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7644/10070 [3:38:03<1:09:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7644/10070 [3:38:03<1:09:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7645/10070 [3:38:03<1:09:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7645/10070 [3:38:03<1:09:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7646/10070 [3:38:04<1:09:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7646/10070 [3:38:04<1:09:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7647/10070 [3:38:06<1:09:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7647/10070 [3:38:06<1:09:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7648/10070 [3:38:15<1:09:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7648/10070 [3:38:15<1:09:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7649/10070 [3:38:16<1:09:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7649/10070 [3:38:16<1:09:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7650/10070 [3:38:18<1:09:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7650/10070 [3:38:18<1:09:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7651/10070 [3:38:20<1:09:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7651/10070 [3:38:20<1:09:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7652/10070 [3:38:21<1:08:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7652/10070 [3:38:21<1:08:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7653/10070 [3:38:23<1:08:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7653/10070 [3:38:23<1:08:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7654/10070 [3:38:24<1:08:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7654/10070 [3:38:24<1:08:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7655/10070 [3:38:26<1:08:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7655/10070 [3:38:26<1:08:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7656/10070 [3:38:26<1:08:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7656/10070 [3:38:26<1:08:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7657/10070 [3:38:27<1:08:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7657/10070 [3:38:27<1:08:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7658/10070 [3:38:30<1:08:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7658/10070 [3:38:30<1:08:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7659/10070 [3:38:31<1:08:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7659/10070 [3:38:31<1:08:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7660/10070 [3:38:33<1:08:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7660/10070 [3:38:33<1:08:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7661/10070 [3:38:34<1:08:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7661/10070 [3:38:34<1:08:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7662/10070 [3:38:35<1:08:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7662/10070 [3:38:35<1:08:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7663/10070 [3:38:36<1:08:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7663/10070 [3:38:36<1:08:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7664/10070 [3:38:38<1:08:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7664/10070 [3:38:38<1:08:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7665/10070 [3:38:40<1:08:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7665/10070 [3:38:40<1:08:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7666/10070 [3:38:40<1:08:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7666/10070 [3:38:40<1:08:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7667/10070 [3:38:42<1:08:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7667/10070 [3:38:42<1:08:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7668/10070 [3:38:43<1:08:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7668/10070 [3:38:43<1:08:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7669/10070 [3:38:44<1:08:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7669/10070 [3:38:44<1:08:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7670/10070 [3:38:46<1:08:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7670/10070 [3:38:46<1:08:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7671/10070 [3:38:48<1:08:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7671/10070 [3:38:48<1:08:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7672/10070 [3:38:49<1:08:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7672/10070 [3:38:49<1:08:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7673/10070 [3:38:50<1:08:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7673/10070 [3:38:50<1:08:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7674/10070 [3:38:52<1:08:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7674/10070 [3:38:52<1:08:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7675/10070 [3:38:53<1:08:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7675/10070 [3:38:53<1:08:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7676/10070 [3:38:54<1:08:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7676/10070 [3:38:54<1:08:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7677/10070 [3:38:56<1:08:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7677/10070 [3:38:56<1:08:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7678/10070 [3:38:56<1:08:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7678/10070 [3:38:56<1:08:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7679/10070 [3:38:58<1:08:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7679/10070 [3:38:58<1:08:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7680/10070 [3:39:06<1:08:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7680/10070 [3:39:06<1:08:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7681/10070 [3:39:08<1:08:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7681/10070 [3:39:08<1:08:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7682/10070 [3:39:10<1:08:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7682/10070 [3:39:10<1:08:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7683/10070 [3:39:12<1:08:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7683/10070 [3:39:12<1:08:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7684/10070 [3:39:14<1:08:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7684/10070 [3:39:14<1:08:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7685/10070 [3:39:16<1:08:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7685/10070 [3:39:16<1:08:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7686/10070 [3:39:17<1:08:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7686/10070 [3:39:17<1:08:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7687/10070 [3:39:18<1:07:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7687/10070 [3:39:18<1:07:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7688/10070 [3:39:20<1:07:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7688/10070 [3:39:20<1:07:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7689/10070 [3:39:22<1:07:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7689/10070 [3:39:22<1:07:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7690/10070 [3:39:23<1:07:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7690/10070 [3:39:23<1:07:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7691/10070 [3:39:25<1:07:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7691/10070 [3:39:25<1:07:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7692/10070 [3:39:27<1:07:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7692/10070 [3:39:27<1:07:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7693/10070 [3:39:27<1:07:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7693/10070 [3:39:27<1:07:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7694/10070 [3:39:28<1:07:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7694/10070 [3:39:28<1:07:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7695/10070 [3:39:29<1:07:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7695/10070 [3:39:29<1:07:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7696/10070 [3:39:31<1:07:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7696/10070 [3:39:31<1:07:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7697/10070 [3:39:31<1:07:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7697/10070 [3:39:31<1:07:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7698/10070 [3:39:32<1:07:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7698/10070 [3:39:32<1:07:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7699/10070 [3:39:33<1:07:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7699/10070 [3:39:33<1:07:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7700/10070 [3:39:34<1:07:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7700/10070 [3:39:34<1:07:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7701/10070 [3:39:36<1:07:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7701/10070 [3:39:36<1:07:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7702/10070 [3:39:38<1:07:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7702/10070 [3:39:38<1:07:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  76%|▊| 7703/10070 [3:39:39<1:07:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  76%|▊| 7703/10070 [3:39:39<1:07:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7704/10070 [3:39:40<1:07:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7704/10070 [3:39:40<1:07:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7705/10070 [3:39:41<1:07:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7705/10070 [3:39:41<1:07:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7706/10070 [3:39:43<1:07:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7706/10070 [3:39:43<1:07:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7707/10070 [3:39:45<1:07:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7707/10070 [3:39:45<1:07:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7708/10070 [3:39:46<1:07:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7708/10070 [3:39:46<1:07:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7709/10070 [3:39:46<1:07:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7709/10070 [3:39:46<1:07:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7710/10070 [3:39:47<1:07:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7710/10070 [3:39:47<1:07:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7711/10070 [3:39:48<1:07:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7711/10070 [3:39:48<1:07:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7712/10070 [3:40:00<1:07:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7712/10070 [3:40:00<1:07:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7713/10070 [3:40:02<1:07:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7713/10070 [3:40:02<1:07:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7714/10070 [3:40:03<1:07:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7714/10070 [3:40:03<1:07:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7715/10070 [3:40:03<1:07:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7715/10070 [3:40:03<1:07:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7716/10070 [3:40:06<1:07:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7716/10070 [3:40:06<1:07:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7717/10070 [3:40:06<1:07:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7717/10070 [3:40:06<1:07:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7718/10070 [3:40:07<1:07:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7718/10070 [3:40:07<1:07:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7719/10070 [3:40:08<1:07:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7719/10070 [3:40:08<1:07:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7720/10070 [3:40:09<1:07:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7720/10070 [3:40:09<1:07:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7721/10070 [3:40:10<1:06:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7721/10070 [3:40:10<1:06:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7722/10070 [3:40:11<1:06:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7722/10070 [3:40:11<1:06:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7723/10070 [3:40:12<1:06:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7723/10070 [3:40:12<1:06:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7724/10070 [3:40:13<1:06:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7724/10070 [3:40:13<1:06:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7725/10070 [3:40:14<1:06:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7725/10070 [3:40:14<1:06:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7726/10070 [3:40:16<1:06:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7726/10070 [3:40:16<1:06:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7727/10070 [3:40:19<1:06:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7727/10070 [3:40:19<1:06:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7728/10070 [3:40:20<1:06:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7728/10070 [3:40:20<1:06:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7729/10070 [3:40:21<1:06:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7729/10070 [3:40:21<1:06:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7730/10070 [3:40:23<1:06:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7730/10070 [3:40:23<1:06:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7731/10070 [3:40:24<1:06:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7731/10070 [3:40:24<1:06:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7732/10070 [3:40:25<1:06:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7732/10070 [3:40:25<1:06:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7733/10070 [3:40:26<1:06:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7733/10070 [3:40:26<1:06:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7734/10070 [3:40:29<1:06:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7734/10070 [3:40:29<1:06:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7735/10070 [3:40:30<1:06:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7735/10070 [3:40:30<1:06:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7736/10070 [3:40:30<1:06:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7736/10070 [3:40:30<1:06:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7737/10070 [3:40:33<1:06:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7737/10070 [3:40:33<1:06:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7738/10070 [3:40:35<1:06:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7738/10070 [3:40:35<1:06:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7739/10070 [3:40:37<1:06:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7739/10070 [3:40:37<1:06:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7740/10070 [3:40:37<1:06:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7740/10070 [3:40:37<1:06:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7741/10070 [3:40:39<1:06:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7741/10070 [3:40:39<1:06:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7742/10070 [3:40:39<1:06:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7742/10070 [3:40:39<1:06:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7743/10070 [3:40:40<1:06:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7743/10070 [3:40:40<1:06:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7744/10070 [3:40:50<1:06:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7744/10070 [3:40:50<1:06:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7745/10070 [3:40:51<1:06:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7745/10070 [3:40:51<1:06:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7746/10070 [3:40:52<1:06:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7746/10070 [3:40:52<1:06:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7747/10070 [3:40:53<1:06:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7747/10070 [3:40:53<1:06:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7748/10070 [3:40:55<1:06:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7748/10070 [3:40:55<1:06:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7749/10070 [3:40:56<1:06:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7749/10070 [3:40:56<1:06:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7750/10070 [3:40:57<1:06:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7750/10070 [3:40:57<1:06:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7751/10070 [3:40:58<1:06:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7751/10070 [3:40:58<1:06:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7752/10070 [3:40:59<1:06:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7752/10070 [3:40:59<1:06:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7753/10070 [3:41:00<1:06:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7753/10070 [3:41:00<1:06:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7754/10070 [3:41:02<1:06:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7754/10070 [3:41:02<1:06:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7755/10070 [3:41:04<1:05:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7755/10070 [3:41:04<1:05:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7756/10070 [3:41:04<1:05:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7756/10070 [3:41:04<1:05:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7757/10070 [3:41:06<1:05:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7757/10070 [3:41:06<1:05:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7758/10070 [3:41:08<1:05:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7758/10070 [3:41:08<1:05:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7759/10070 [3:41:09<1:05:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7759/10070 [3:41:09<1:05:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7760/10070 [3:41:11<1:05:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7760/10070 [3:41:11<1:05:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7761/10070 [3:41:12<1:05:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7761/10070 [3:41:12<1:05:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7762/10070 [3:41:14<1:05:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7762/10070 [3:41:14<1:05:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7763/10070 [3:41:16<1:05:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7763/10070 [3:41:16<1:05:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7764/10070 [3:41:18<1:05:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7764/10070 [3:41:18<1:05:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7765/10070 [3:41:20<1:05:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7765/10070 [3:41:20<1:05:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7766/10070 [3:41:21<1:05:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7766/10070 [3:41:21<1:05:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7767/10070 [3:41:23<1:05:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7767/10070 [3:41:23<1:05:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7768/10070 [3:41:25<1:05:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7768/10070 [3:41:25<1:05:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7769/10070 [3:41:27<1:05:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7769/10070 [3:41:27<1:05:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7770/10070 [3:41:28<1:05:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7770/10070 [3:41:28<1:05:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7771/10070 [3:41:28<1:05:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7771/10070 [3:41:28<1:05:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7772/10070 [3:41:29<1:05:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7772/10070 [3:41:29<1:05:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7773/10070 [3:41:31<1:05:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7773/10070 [3:41:31<1:05:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7774/10070 [3:41:32<1:05:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7774/10070 [3:41:32<1:05:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7775/10070 [3:41:32<1:05:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7775/10070 [3:41:32<1:05:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7776/10070 [3:41:43<1:05:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7776/10070 [3:41:43<1:05:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7777/10070 [3:41:45<1:05:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7777/10070 [3:41:45<1:05:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7778/10070 [3:41:46<1:05:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7778/10070 [3:41:46<1:05:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7779/10070 [3:41:48<1:05:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7779/10070 [3:41:48<1:05:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7780/10070 [3:41:49<1:05:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7780/10070 [3:41:49<1:05:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7781/10070 [3:41:50<1:05:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7781/10070 [3:41:50<1:05:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7782/10070 [3:41:53<1:05:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7782/10070 [3:41:53<1:05:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7783/10070 [3:41:55<1:05:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7783/10070 [3:41:55<1:05:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7784/10070 [3:41:56<1:05:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7784/10070 [3:41:56<1:05:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7785/10070 [3:41:57<1:05:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7785/10070 [3:41:57<1:05:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7786/10070 [3:41:59<1:05:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7786/10070 [3:41:59<1:05:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7787/10070 [3:42:01<1:05:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7787/10070 [3:42:01<1:05:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7788/10070 [3:42:03<1:05:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7788/10070 [3:42:03<1:05:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7789/10070 [3:42:04<1:05:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7789/10070 [3:42:04<1:05:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7790/10070 [3:42:05<1:05:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7790/10070 [3:42:05<1:05:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7791/10070 [3:42:06<1:04:58,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7791/10070 [3:42:06<1:04:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7792/10070 [3:42:08<1:04:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7792/10070 [3:42:08<1:04:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7793/10070 [3:42:09<1:04:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7793/10070 [3:42:09<1:04:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7794/10070 [3:42:10<1:04:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7794/10070 [3:42:10<1:04:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7795/10070 [3:42:12<1:04:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7795/10070 [3:42:12<1:04:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7796/10070 [3:42:13<1:04:49,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7796/10070 [3:42:13<1:04:49,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7797/10070 [3:42:14<1:04:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7797/10070 [3:42:14<1:04:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7798/10070 [3:42:15<1:04:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7798/10070 [3:42:15<1:04:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7799/10070 [3:42:15<1:04:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7799/10070 [3:42:15<1:04:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7800/10070 [3:42:16<1:04:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7800/10070 [3:42:16<1:04:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7801/10070 [3:42:17<1:04:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7801/10070 [3:42:17<1:04:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7802/10070 [3:42:18<1:04:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7802/10070 [3:42:18<1:04:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7803/10070 [3:42:20<1:04:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7803/10070 [3:42:20<1:04:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  77%|▊| 7804/10070 [3:42:22<1:04:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  77%|▊| 7804/10070 [3:42:22<1:04:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7805/10070 [3:42:24<1:04:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7805/10070 [3:42:24<1:04:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7806/10070 [3:42:26<1:04:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7806/10070 [3:42:26<1:04:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7807/10070 [3:42:27<1:04:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7807/10070 [3:42:27<1:04:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7808/10070 [3:42:37<1:04:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7808/10070 [3:42:37<1:04:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7809/10070 [3:42:39<1:04:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7809/10070 [3:42:39<1:04:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7810/10070 [3:42:41<1:04:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7810/10070 [3:42:41<1:04:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7811/10070 [3:42:41<1:04:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7811/10070 [3:42:41<1:04:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7812/10070 [3:42:44<1:04:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7812/10070 [3:42:44<1:04:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7813/10070 [3:42:46<1:04:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7813/10070 [3:42:46<1:04:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7814/10070 [3:42:48<1:04:19,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7814/10070 [3:42:48<1:04:19,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7815/10070 [3:42:50<1:04:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7815/10070 [3:42:50<1:04:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7816/10070 [3:42:51<1:04:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7816/10070 [3:42:51<1:04:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7817/10070 [3:42:53<1:04:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7817/10070 [3:42:53<1:04:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7818/10070 [3:42:55<1:04:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7818/10070 [3:42:55<1:04:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7819/10070 [3:42:55<1:04:10,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7819/10070 [3:42:55<1:04:10,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7820/10070 [3:42:57<1:04:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7820/10070 [3:42:57<1:04:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7821/10070 [3:42:59<1:04:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7821/10070 [3:42:59<1:04:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7822/10070 [3:43:00<1:04:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7822/10070 [3:43:00<1:04:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7823/10070 [3:43:02<1:04:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7823/10070 [3:43:02<1:04:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7824/10070 [3:43:03<1:04:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7824/10070 [3:43:03<1:04:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7825/10070 [3:43:04<1:04:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7825/10070 [3:43:04<1:04:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7826/10070 [3:43:06<1:03:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7826/10070 [3:43:06<1:03:58,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7827/10070 [3:43:07<1:03:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7827/10070 [3:43:07<1:03:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7828/10070 [3:43:07<1:03:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7828/10070 [3:43:07<1:03:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7829/10070 [3:43:09<1:03:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7829/10070 [3:43:09<1:03:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7830/10070 [3:43:10<1:03:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7830/10070 [3:43:10<1:03:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7831/10070 [3:43:10<1:03:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7831/10070 [3:43:10<1:03:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7832/10070 [3:43:11<1:03:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7832/10070 [3:43:11<1:03:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7833/10070 [3:43:13<1:03:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7833/10070 [3:43:13<1:03:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7834/10070 [3:43:16<1:03:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7834/10070 [3:43:16<1:03:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7835/10070 [3:43:17<1:03:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7835/10070 [3:43:17<1:03:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7836/10070 [3:43:19<1:03:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7836/10070 [3:43:19<1:03:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7837/10070 [3:43:20<1:03:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7837/10070 [3:43:20<1:03:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7838/10070 [3:43:22<1:03:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7838/10070 [3:43:22<1:03:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7839/10070 [3:43:23<1:03:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7839/10070 [3:43:23<1:03:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7840/10070 [3:43:31<1:03:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7840/10070 [3:43:31<1:03:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7841/10070 [3:43:33<1:03:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7841/10070 [3:43:33<1:03:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7842/10070 [3:43:34<1:03:31,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7842/10070 [3:43:34<1:03:31,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7843/10070 [3:43:35<1:03:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7843/10070 [3:43:35<1:03:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7844/10070 [3:43:37<1:03:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7844/10070 [3:43:37<1:03:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7845/10070 [3:43:39<1:03:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7845/10070 [3:43:39<1:03:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7846/10070 [3:43:40<1:03:24,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7846/10070 [3:43:40<1:03:24,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7847/10070 [3:43:41<1:03:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7847/10070 [3:43:41<1:03:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7848/10070 [3:43:42<1:03:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7848/10070 [3:43:42<1:03:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7849/10070 [3:43:43<1:03:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7849/10070 [3:43:43<1:03:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7850/10070 [3:43:45<1:03:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7850/10070 [3:43:45<1:03:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7851/10070 [3:43:46<1:03:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7851/10070 [3:43:46<1:03:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7852/10070 [3:43:47<1:03:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7852/10070 [3:43:47<1:03:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7853/10070 [3:43:48<1:03:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7853/10070 [3:43:48<1:03:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7854/10070 [3:43:50<1:03:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7854/10070 [3:43:50<1:03:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7855/10070 [3:43:51<1:03:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7855/10070 [3:43:51<1:03:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7856/10070 [3:43:53<1:03:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7856/10070 [3:43:53<1:03:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7857/10070 [3:43:55<1:03:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7857/10070 [3:43:55<1:03:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7858/10070 [3:43:57<1:03:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7858/10070 [3:43:57<1:03:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7859/10070 [3:43:59<1:03:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7859/10070 [3:43:59<1:03:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7860/10070 [3:44:01<1:02:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7860/10070 [3:44:01<1:02:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7861/10070 [3:44:03<1:02:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7861/10070 [3:44:03<1:02:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7862/10070 [3:44:05<1:02:56,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7862/10070 [3:44:05<1:02:56,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7863/10070 [3:44:07<1:02:54,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7863/10070 [3:44:07<1:02:54,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7864/10070 [3:44:08<1:02:52,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7864/10070 [3:44:08<1:02:52,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7865/10070 [3:44:10<1:02:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7865/10070 [3:44:10<1:02:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7866/10070 [3:44:11<1:02:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7866/10070 [3:44:11<1:02:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7867/10070 [3:44:11<1:02:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7867/10070 [3:44:11<1:02:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7868/10070 [3:44:12<1:02:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7868/10070 [3:44:12<1:02:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7869/10070 [3:44:14<1:02:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7869/10070 [3:44:14<1:02:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7870/10070 [3:44:16<1:02:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7870/10070 [3:44:16<1:02:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7871/10070 [3:44:18<1:02:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7871/10070 [3:44:18<1:02:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7872/10070 [3:44:24<1:02:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7872/10070 [3:44:24<1:02:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7873/10070 [3:44:26<1:02:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7873/10070 [3:44:26<1:02:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7874/10070 [3:44:26<1:02:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7874/10070 [3:44:26<1:02:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7875/10070 [3:44:29<1:02:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7875/10070 [3:44:29<1:02:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7876/10070 [3:44:30<1:02:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7876/10070 [3:44:30<1:02:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7877/10070 [3:44:33<1:02:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7877/10070 [3:44:33<1:02:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7878/10070 [3:44:34<1:02:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7878/10070 [3:44:34<1:02:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7879/10070 [3:44:35<1:02:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7879/10070 [3:44:35<1:02:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7880/10070 [3:44:37<1:02:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7880/10070 [3:44:37<1:02:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7881/10070 [3:44:38<1:02:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7881/10070 [3:44:38<1:02:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7882/10070 [3:44:41<1:02:22,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7882/10070 [3:44:41<1:02:22,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7883/10070 [3:44:43<1:02:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7883/10070 [3:44:43<1:02:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7884/10070 [3:44:44<1:02:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7884/10070 [3:44:44<1:02:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7885/10070 [3:44:46<1:02:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7885/10070 [3:44:46<1:02:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7886/10070 [3:44:47<1:02:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7886/10070 [3:44:47<1:02:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7887/10070 [3:44:48<1:02:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7887/10070 [3:44:48<1:02:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7888/10070 [3:44:49<1:02:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7888/10070 [3:44:49<1:02:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7889/10070 [3:44:49<1:02:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7889/10070 [3:44:49<1:02:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7890/10070 [3:44:51<1:02:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7890/10070 [3:44:51<1:02:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7891/10070 [3:44:54<1:02:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7891/10070 [3:44:54<1:02:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7892/10070 [3:44:56<1:02:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7892/10070 [3:44:56<1:02:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7893/10070 [3:44:58<1:02:03,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7893/10070 [3:44:58<1:02:03,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7894/10070 [3:45:00<1:02:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7894/10070 [3:45:00<1:02:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7895/10070 [3:45:01<1:01:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7895/10070 [3:45:01<1:01:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7896/10070 [3:45:03<1:01:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7896/10070 [3:45:03<1:01:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7897/10070 [3:45:04<1:01:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7897/10070 [3:45:04<1:01:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7898/10070 [3:45:05<1:01:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7898/10070 [3:45:05<1:01:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7899/10070 [3:45:05<1:01:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7899/10070 [3:45:05<1:01:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7900/10070 [3:45:08<1:01:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7900/10070 [3:45:08<1:01:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7901/10070 [3:45:09<1:01:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7901/10070 [3:45:09<1:01:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7902/10070 [3:45:11<1:01:47,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7902/10070 [3:45:11<1:01:47,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7903/10070 [3:45:13<1:01:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7903/10070 [3:45:13<1:01:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  78%|▊| 7904/10070 [3:45:20<1:01:45,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  78%|▊| 7904/10070 [3:45:20<1:01:45,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7905/10070 [3:45:21<1:01:43,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7905/10070 [3:45:21<1:01:43,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7906/10070 [3:45:23<1:01:41,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7906/10070 [3:45:23<1:01:41,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7907/10070 [3:45:24<1:01:39,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7907/10070 [3:45:24<1:01:39,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7908/10070 [3:45:25<1:01:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7908/10070 [3:45:25<1:01:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7909/10070 [3:45:27<1:01:36,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7909/10070 [3:45:27<1:01:36,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7910/10070 [3:45:28<1:01:34,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7910/10070 [3:45:28<1:01:34,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7911/10070 [3:45:30<1:01:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7911/10070 [3:45:30<1:01:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7912/10070 [3:45:32<1:01:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7912/10070 [3:45:32<1:01:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7913/10070 [3:45:33<1:01:29,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7913/10070 [3:45:33<1:01:29,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7914/10070 [3:45:34<1:01:27,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7914/10070 [3:45:34<1:01:27,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7915/10070 [3:45:35<1:01:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7915/10070 [3:45:35<1:01:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7916/10070 [3:45:37<1:01:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7916/10070 [3:45:37<1:01:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7917/10070 [3:45:39<1:01:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7917/10070 [3:45:39<1:01:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7918/10070 [3:45:41<1:01:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7918/10070 [3:45:41<1:01:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7919/10070 [3:45:43<1:01:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7919/10070 [3:45:43<1:01:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7920/10070 [3:45:45<1:01:17,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7920/10070 [3:45:45<1:01:17,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7921/10070 [3:45:47<1:01:15,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7921/10070 [3:45:47<1:01:15,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7922/10070 [3:45:49<1:01:13,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7922/10070 [3:45:49<1:01:13,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7923/10070 [3:45:49<1:01:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7923/10070 [3:45:49<1:01:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7924/10070 [3:45:50<1:01:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7924/10070 [3:45:50<1:01:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7925/10070 [3:45:52<1:01:08,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7925/10070 [3:45:52<1:01:08,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7926/10070 [3:45:53<1:01:06,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7926/10070 [3:45:53<1:01:06,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7927/10070 [3:45:54<1:01:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7927/10070 [3:45:54<1:01:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7928/10070 [3:45:56<1:01:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7928/10070 [3:45:56<1:01:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7929/10070 [3:45:58<1:01:01,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7929/10070 [3:45:58<1:01:01,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7930/10070 [3:45:58<1:00:59,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7930/10070 [3:45:58<1:00:59,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7931/10070 [3:45:59<1:00:57,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7931/10070 [3:45:59<1:00:57,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7932/10070 [3:46:00<1:00:55,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7932/10070 [3:46:00<1:00:55,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7933/10070 [3:46:02<1:00:53,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7933/10070 [3:46:02<1:00:53,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7934/10070 [3:46:04<1:00:51,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7934/10070 [3:46:04<1:00:51,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7935/10070 [3:46:06<1:00:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7935/10070 [3:46:06<1:00:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7936/10070 [3:46:14<1:00:50,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7936/10070 [3:46:14<1:00:50,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7937/10070 [3:46:15<1:00:48,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7937/10070 [3:46:15<1:00:48,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7938/10070 [3:46:15<1:00:46,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7938/10070 [3:46:15<1:00:46,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7939/10070 [3:46:18<1:00:44,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7939/10070 [3:46:18<1:00:44,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7940/10070 [3:46:18<1:00:42,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7940/10070 [3:46:18<1:00:42,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7941/10070 [3:46:19<1:00:40,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7941/10070 [3:46:19<1:00:40,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7942/10070 [3:46:21<1:00:38,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7942/10070 [3:46:21<1:00:38,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7943/10070 [3:46:22<1:00:37,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7943/10070 [3:46:22<1:00:37,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7944/10070 [3:46:24<1:00:35,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7944/10070 [3:46:24<1:00:35,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7945/10070 [3:46:25<1:00:33,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7945/10070 [3:46:25<1:00:33,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7946/10070 [3:46:27<1:00:32,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7946/10070 [3:46:27<1:00:32,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7947/10070 [3:46:29<1:00:30,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7947/10070 [3:46:29<1:00:30,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7948/10070 [3:46:31<1:00:28,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7948/10070 [3:46:31<1:00:28,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7949/10070 [3:46:32<1:00:26,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7949/10070 [3:46:32<1:00:26,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7950/10070 [3:46:34<1:00:25,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7950/10070 [3:46:34<1:00:25,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7951/10070 [3:46:35<1:00:23,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7951/10070 [3:46:35<1:00:23,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7952/10070 [3:46:37<1:00:21,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7952/10070 [3:46:37<1:00:21,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7953/10070 [3:46:39<1:00:20,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7953/10070 [3:46:39<1:00:20,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7954/10070 [3:46:41<1:00:18,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7954/10070 [3:46:41<1:00:18,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7955/10070 [3:46:42<1:00:16,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7955/10070 [3:46:42<1:00:16,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7956/10070 [3:46:44<1:00:14,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7956/10070 [3:46:44<1:00:14,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7957/10070 [3:46:45<1:00:12,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7957/10070 [3:46:45<1:00:12,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7958/10070 [3:46:47<1:00:11,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7958/10070 [3:46:47<1:00:11,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7959/10070 [3:46:48<1:00:09,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7959/10070 [3:46:48<1:00:09,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7960/10070 [3:46:49<1:00:07,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7960/10070 [3:46:49<1:00:07,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7961/10070 [3:46:51<1:00:05,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7961/10070 [3:46:51<1:00:05,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7962/10070 [3:46:53<1:00:04,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7962/10070 [3:46:53<1:00:04,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7963/10070 [3:46:54<1:00:02,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7963/10070 [3:46:54<1:00:02,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7964/10070 [3:46:55<1:00:00,  1.71s/it, v_num=tif6, train/loss=\r",
-      "Epoch 0:  79%|▊| 7964/10070 [3:46:55<1:00:00,  1.71s/it, v_num=tif6, train/loss="
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7965/10070 [3:46:57<59:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7965/10070 [3:46:57<59:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7966/10070 [3:46:59<59:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7966/10070 [3:46:59<59:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7967/10070 [3:47:01<59:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7967/10070 [3:47:01<59:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7968/10070 [3:47:09<59:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7968/10070 [3:47:09<59:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7969/10070 [3:47:11<59:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7969/10070 [3:47:11<59:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7970/10070 [3:47:12<59:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7970/10070 [3:47:12<59:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7971/10070 [3:47:13<59:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7971/10070 [3:47:13<59:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7972/10070 [3:47:14<59:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7972/10070 [3:47:14<59:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7973/10070 [3:47:14<59:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7973/10070 [3:47:14<59:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7974/10070 [3:47:16<59:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7974/10070 [3:47:16<59:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7975/10070 [3:47:18<59:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7975/10070 [3:47:18<59:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7976/10070 [3:47:19<59:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7976/10070 [3:47:19<59:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7977/10070 [3:47:20<59:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7977/10070 [3:47:20<59:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7978/10070 [3:47:22<59:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7978/10070 [3:47:22<59:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7979/10070 [3:47:23<59:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7979/10070 [3:47:23<59:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7980/10070 [3:47:25<59:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7980/10070 [3:47:25<59:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7981/10070 [3:47:26<59:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7981/10070 [3:47:26<59:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7982/10070 [3:47:28<59:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7982/10070 [3:47:28<59:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7983/10070 [3:47:29<59:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7983/10070 [3:47:29<59:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7984/10070 [3:47:30<59:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7984/10070 [3:47:30<59:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7985/10070 [3:47:31<59:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7985/10070 [3:47:31<59:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7986/10070 [3:47:33<59:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7986/10070 [3:47:33<59:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7987/10070 [3:47:35<59:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7987/10070 [3:47:35<59:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7988/10070 [3:47:35<59:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7988/10070 [3:47:35<59:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7989/10070 [3:47:37<59:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7989/10070 [3:47:37<59:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7990/10070 [3:47:39<59:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7990/10070 [3:47:39<59:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7991/10070 [3:47:40<59:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7991/10070 [3:47:40<59:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7992/10070 [3:47:41<59:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7992/10070 [3:47:41<59:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7993/10070 [3:47:43<59:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7993/10070 [3:47:43<59:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7994/10070 [3:47:45<59:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7994/10070 [3:47:45<59:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7995/10070 [3:47:46<59:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7995/10070 [3:47:46<59:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7996/10070 [3:47:46<59:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7996/10070 [3:47:46<59:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7997/10070 [3:47:48<59:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7997/10070 [3:47:48<59:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7998/10070 [3:47:49<59:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7998/10070 [3:47:49<59:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 7999/10070 [3:47:51<58:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 7999/10070 [3:47:51<58:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 8000/10070 [3:47:59<58:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 8000/10070 [3:47:59<58:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 8001/10070 [3:48:22<59:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 8001/10070 [3:48:22<59:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 8002/10070 [3:48:23<59:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 8002/10070 [3:48:23<59:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 8003/10070 [3:48:24<58:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 8003/10070 [3:48:24<58:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 8004/10070 [3:48:25<58:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 8004/10070 [3:48:25<58:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  79%|▊| 8005/10070 [3:48:26<58:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  79%|▊| 8005/10070 [3:48:26<58:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8006/10070 [3:48:28<58:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8006/10070 [3:48:28<58:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8007/10070 [3:48:30<58:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8007/10070 [3:48:30<58:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8008/10070 [3:48:32<58:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8008/10070 [3:48:32<58:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8009/10070 [3:48:33<58:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8009/10070 [3:48:33<58:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8010/10070 [3:48:33<58:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8010/10070 [3:48:33<58:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8011/10070 [3:48:36<58:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8011/10070 [3:48:36<58:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8012/10070 [3:48:38<58:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8012/10070 [3:48:38<58:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8013/10070 [3:48:40<58:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8013/10070 [3:48:40<58:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8014/10070 [3:48:42<58:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8014/10070 [3:48:42<58:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8015/10070 [3:48:44<58:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8015/10070 [3:48:44<58:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8016/10070 [3:48:46<58:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8016/10070 [3:48:46<58:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8017/10070 [3:48:47<58:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8017/10070 [3:48:47<58:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8018/10070 [3:48:49<58:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8018/10070 [3:48:49<58:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8019/10070 [3:48:51<58:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8019/10070 [3:48:51<58:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8020/10070 [3:48:52<58:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8020/10070 [3:48:52<58:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8021/10070 [3:48:55<58:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8021/10070 [3:48:55<58:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8022/10070 [3:48:55<58:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8022/10070 [3:48:55<58:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8023/10070 [3:48:57<58:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8023/10070 [3:48:57<58:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8024/10070 [3:48:59<58:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8024/10070 [3:48:59<58:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8025/10070 [3:49:00<58:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8025/10070 [3:49:00<58:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8026/10070 [3:49:02<58:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8026/10070 [3:49:02<58:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8027/10070 [3:49:03<58:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8027/10070 [3:49:03<58:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8028/10070 [3:49:05<58:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8028/10070 [3:49:05<58:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8029/10070 [3:49:07<58:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8029/10070 [3:49:07<58:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8030/10070 [3:49:09<58:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8030/10070 [3:49:09<58:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8031/10070 [3:49:11<58:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8031/10070 [3:49:11<58:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8032/10070 [3:49:17<58:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8032/10070 [3:49:17<58:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8033/10070 [3:49:18<58:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8033/10070 [3:49:18<58:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8034/10070 [3:49:19<58:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8034/10070 [3:49:19<58:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8035/10070 [3:49:21<58:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8035/10070 [3:49:21<58:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8036/10070 [3:49:22<58:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8036/10070 [3:49:22<58:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8037/10070 [3:49:23<58:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8037/10070 [3:49:23<58:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8038/10070 [3:49:23<57:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8038/10070 [3:49:23<57:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8039/10070 [3:49:25<57:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8039/10070 [3:49:25<57:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8040/10070 [3:49:27<57:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8040/10070 [3:49:27<57:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8041/10070 [3:49:28<57:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8041/10070 [3:49:28<57:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8042/10070 [3:49:29<57:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8042/10070 [3:49:29<57:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8043/10070 [3:49:30<57:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8043/10070 [3:49:30<57:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8044/10070 [3:49:32<57:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8044/10070 [3:49:32<57:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8045/10070 [3:49:34<57:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8045/10070 [3:49:34<57:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8046/10070 [3:49:35<57:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8046/10070 [3:49:35<57:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8047/10070 [3:49:36<57:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8047/10070 [3:49:36<57:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8048/10070 [3:49:37<57:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8048/10070 [3:49:37<57:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8049/10070 [3:49:39<57:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8049/10070 [3:49:39<57:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8050/10070 [3:49:40<57:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8050/10070 [3:49:40<57:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8051/10070 [3:49:41<57:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8051/10070 [3:49:41<57:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8052/10070 [3:49:42<57:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8052/10070 [3:49:42<57:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8053/10070 [3:49:44<57:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8053/10070 [3:49:44<57:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8054/10070 [3:49:44<57:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8054/10070 [3:49:44<57:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8055/10070 [3:49:45<57:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8055/10070 [3:49:45<57:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8056/10070 [3:49:46<57:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8056/10070 [3:49:46<57:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8057/10070 [3:49:47<57:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8057/10070 [3:49:47<57:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8058/10070 [3:49:48<57:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8058/10070 [3:49:48<57:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8059/10070 [3:49:50<57:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8059/10070 [3:49:50<57:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8060/10070 [3:49:50<57:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8060/10070 [3:49:50<57:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8061/10070 [3:49:52<57:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8061/10070 [3:49:52<57:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8062/10070 [3:49:54<57:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8062/10070 [3:49:54<57:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8063/10070 [3:49:54<57:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8063/10070 [3:49:54<57:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8064/10070 [3:50:10<57:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8064/10070 [3:50:10<57:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8065/10070 [3:50:10<57:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8065/10070 [3:50:10<57:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8066/10070 [3:50:13<57:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8066/10070 [3:50:13<57:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8067/10070 [3:50:14<57:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8067/10070 [3:50:14<57:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8068/10070 [3:50:15<57:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8068/10070 [3:50:15<57:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8069/10070 [3:50:16<57:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8069/10070 [3:50:16<57:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8070/10070 [3:50:17<57:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8070/10070 [3:50:17<57:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8071/10070 [3:50:19<57:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8071/10070 [3:50:19<57:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8072/10070 [3:50:20<57:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8072/10070 [3:50:20<57:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8073/10070 [3:50:21<56:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8073/10070 [3:50:21<56:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8074/10070 [3:50:22<56:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8074/10070 [3:50:22<56:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8075/10070 [3:50:22<56:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8075/10070 [3:50:22<56:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8076/10070 [3:50:24<56:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8076/10070 [3:50:24<56:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8077/10070 [3:50:26<56:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8077/10070 [3:50:26<56:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8078/10070 [3:50:28<56:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8078/10070 [3:50:28<56:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8079/10070 [3:50:30<56:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8079/10070 [3:50:30<56:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8080/10070 [3:50:31<56:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8080/10070 [3:50:31<56:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8081/10070 [3:50:32<56:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8081/10070 [3:50:32<56:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8082/10070 [3:50:34<56:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8082/10070 [3:50:34<56:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8083/10070 [3:50:35<56:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8083/10070 [3:50:35<56:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8084/10070 [3:50:36<56:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8084/10070 [3:50:36<56:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8085/10070 [3:50:37<56:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8085/10070 [3:50:37<56:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8086/10070 [3:50:39<56:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8086/10070 [3:50:39<56:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8087/10070 [3:50:40<56:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8087/10070 [3:50:40<56:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8088/10070 [3:50:40<56:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8088/10070 [3:50:40<56:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8089/10070 [3:50:41<56:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8089/10070 [3:50:41<56:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8090/10070 [3:50:42<56:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8090/10070 [3:50:42<56:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8091/10070 [3:50:44<56:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8091/10070 [3:50:44<56:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8092/10070 [3:50:46<56:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8092/10070 [3:50:46<56:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8093/10070 [3:50:47<56:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8093/10070 [3:50:47<56:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8094/10070 [3:50:48<56:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8094/10070 [3:50:48<56:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8095/10070 [3:50:49<56:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8095/10070 [3:50:49<56:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8096/10070 [3:51:05<56:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8096/10070 [3:51:05<56:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8097/10070 [3:51:06<56:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8097/10070 [3:51:06<56:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8098/10070 [3:51:08<56:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8098/10070 [3:51:08<56:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8099/10070 [3:51:08<56:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8099/10070 [3:51:08<56:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8100/10070 [3:51:09<56:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8100/10070 [3:51:09<56:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8101/10070 [3:51:11<56:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8101/10070 [3:51:11<56:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8102/10070 [3:51:11<56:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8102/10070 [3:51:11<56:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8103/10070 [3:51:13<56:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8103/10070 [3:51:13<56:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8104/10070 [3:51:14<56:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8104/10070 [3:51:14<56:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8105/10070 [3:51:16<56:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8105/10070 [3:51:16<56:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  80%|▊| 8106/10070 [3:51:17<56:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  80%|▊| 8106/10070 [3:51:17<56:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8107/10070 [3:51:20<56:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8107/10070 [3:51:20<56:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8108/10070 [3:51:20<55:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8108/10070 [3:51:20<55:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8109/10070 [3:51:22<55:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8109/10070 [3:51:22<55:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8110/10070 [3:51:23<55:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8110/10070 [3:51:23<55:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8111/10070 [3:51:23<55:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8111/10070 [3:51:23<55:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8112/10070 [3:51:24<55:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8112/10070 [3:51:24<55:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8113/10070 [3:51:25<55:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8113/10070 [3:51:25<55:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8114/10070 [3:51:26<55:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8114/10070 [3:51:26<55:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8115/10070 [3:51:27<55:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8115/10070 [3:51:27<55:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8116/10070 [3:51:30<55:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8116/10070 [3:51:30<55:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8117/10070 [3:51:31<55:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8117/10070 [3:51:31<55:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8118/10070 [3:51:32<55:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8118/10070 [3:51:32<55:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8119/10070 [3:51:34<55:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8119/10070 [3:51:34<55:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8120/10070 [3:51:36<55:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8120/10070 [3:51:36<55:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8121/10070 [3:51:39<55:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8121/10070 [3:51:39<55:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8122/10070 [3:51:40<55:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8122/10070 [3:51:40<55:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8123/10070 [3:51:42<55:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8123/10070 [3:51:42<55:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8124/10070 [3:51:43<55:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8124/10070 [3:51:43<55:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8125/10070 [3:51:45<55:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8125/10070 [3:51:45<55:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8126/10070 [3:51:47<55:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8126/10070 [3:51:47<55:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8127/10070 [3:51:49<55:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8127/10070 [3:51:49<55:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8128/10070 [3:51:56<55:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8128/10070 [3:51:56<55:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8129/10070 [3:51:58<55:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8129/10070 [3:51:58<55:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8130/10070 [3:51:59<55:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8130/10070 [3:51:59<55:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8131/10070 [3:52:00<55:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8131/10070 [3:52:00<55:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8132/10070 [3:52:01<55:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8132/10070 [3:52:01<55:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8133/10070 [3:52:04<55:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8133/10070 [3:52:04<55:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8134/10070 [3:52:05<55:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8134/10070 [3:52:05<55:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8135/10070 [3:52:06<55:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8135/10070 [3:52:06<55:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8136/10070 [3:52:07<55:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8136/10070 [3:52:07<55:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8137/10070 [3:52:09<55:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8137/10070 [3:52:09<55:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8138/10070 [3:52:11<55:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8138/10070 [3:52:11<55:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8139/10070 [3:52:13<55:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8139/10070 [3:52:13<55:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8140/10070 [3:52:14<55:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8140/10070 [3:52:14<55:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8141/10070 [3:52:14<55:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8141/10070 [3:52:14<55:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8142/10070 [3:52:16<55:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8142/10070 [3:52:16<55:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8143/10070 [3:52:18<54:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8143/10070 [3:52:18<54:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8144/10070 [3:52:20<54:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8144/10070 [3:52:20<54:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8145/10070 [3:52:20<54:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8145/10070 [3:52:20<54:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8146/10070 [3:52:21<54:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8146/10070 [3:52:21<54:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8147/10070 [3:52:23<54:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8147/10070 [3:52:23<54:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8148/10070 [3:52:25<54:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8148/10070 [3:52:25<54:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8149/10070 [3:52:26<54:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8149/10070 [3:52:26<54:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8150/10070 [3:52:28<54:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8150/10070 [3:52:28<54:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8151/10070 [3:52:30<54:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8151/10070 [3:52:30<54:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8152/10070 [3:52:30<54:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8152/10070 [3:52:30<54:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8153/10070 [3:52:32<54:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8153/10070 [3:52:32<54:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8154/10070 [3:52:34<54:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8154/10070 [3:52:34<54:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8155/10070 [3:52:35<54:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8155/10070 [3:52:35<54:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8156/10070 [3:52:36<54:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8156/10070 [3:52:36<54:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8157/10070 [3:52:37<54:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8157/10070 [3:52:37<54:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8158/10070 [3:52:38<54:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8158/10070 [3:52:38<54:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8159/10070 [3:52:39<54:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8159/10070 [3:52:39<54:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8160/10070 [3:52:50<54:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8160/10070 [3:52:50<54:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8161/10070 [3:52:51<54:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8161/10070 [3:52:51<54:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8162/10070 [3:52:52<54:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8162/10070 [3:52:52<54:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8163/10070 [3:52:54<54:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8163/10070 [3:52:54<54:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8164/10070 [3:52:55<54:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8164/10070 [3:52:55<54:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8165/10070 [3:52:56<54:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8165/10070 [3:52:56<54:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8166/10070 [3:52:58<54:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8166/10070 [3:52:58<54:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8167/10070 [3:53:00<54:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8167/10070 [3:53:00<54:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8168/10070 [3:53:01<54:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8168/10070 [3:53:01<54:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8169/10070 [3:53:02<54:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8169/10070 [3:53:02<54:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8170/10070 [3:53:04<54:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8170/10070 [3:53:04<54:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8171/10070 [3:53:06<54:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8171/10070 [3:53:06<54:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8172/10070 [3:53:08<54:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8172/10070 [3:53:08<54:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8173/10070 [3:53:10<54:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8173/10070 [3:53:10<54:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8174/10070 [3:53:13<54:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8174/10070 [3:53:13<54:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8175/10070 [3:53:14<54:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8175/10070 [3:53:14<54:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8176/10070 [3:53:15<54:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8176/10070 [3:53:15<54:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8177/10070 [3:53:16<54:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8177/10070 [3:53:16<54:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8178/10070 [3:53:17<53:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8178/10070 [3:53:17<53:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8179/10070 [3:53:19<53:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8179/10070 [3:53:19<53:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8180/10070 [3:53:20<53:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8180/10070 [3:53:20<53:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8181/10070 [3:53:21<53:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8181/10070 [3:53:21<53:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8182/10070 [3:53:22<53:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8182/10070 [3:53:22<53:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8183/10070 [3:53:23<53:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8183/10070 [3:53:23<53:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8184/10070 [3:53:25<53:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8184/10070 [3:53:25<53:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8185/10070 [3:53:26<53:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8185/10070 [3:53:26<53:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8186/10070 [3:53:27<53:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8186/10070 [3:53:27<53:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8187/10070 [3:53:28<53:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8187/10070 [3:53:28<53:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8188/10070 [3:53:29<53:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8188/10070 [3:53:29<53:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8189/10070 [3:53:31<53:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8189/10070 [3:53:31<53:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8190/10070 [3:53:33<53:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8190/10070 [3:53:33<53:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8191/10070 [3:53:35<53:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8191/10070 [3:53:35<53:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8192/10070 [3:53:42<53:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8192/10070 [3:53:42<53:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8193/10070 [3:53:43<53:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8193/10070 [3:53:43<53:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8194/10070 [3:53:44<53:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8194/10070 [3:53:44<53:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8195/10070 [3:53:46<53:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8195/10070 [3:53:46<53:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8196/10070 [3:53:48<53:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8196/10070 [3:53:48<53:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8197/10070 [3:53:49<53:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8197/10070 [3:53:49<53:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8198/10070 [3:53:51<53:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8198/10070 [3:53:51<53:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8199/10070 [3:53:52<53:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8199/10070 [3:53:52<53:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8200/10070 [3:53:55<53:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8200/10070 [3:53:55<53:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8201/10070 [3:53:56<53:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8201/10070 [3:53:56<53:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8202/10070 [3:53:58<53:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8202/10070 [3:53:58<53:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8203/10070 [3:53:59<53:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8203/10070 [3:53:59<53:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8204/10070 [3:54:00<53:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8204/10070 [3:54:00<53:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8205/10070 [3:54:02<53:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8205/10070 [3:54:02<53:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8206/10070 [3:54:03<53:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8206/10070 [3:54:03<53:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  81%|▊| 8207/10070 [3:54:04<53:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  81%|▊| 8207/10070 [3:54:04<53:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8208/10070 [3:54:05<53:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8208/10070 [3:54:05<53:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8209/10070 [3:54:07<53:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8209/10070 [3:54:07<53:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8210/10070 [3:54:09<53:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8210/10070 [3:54:09<53:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8211/10070 [3:54:11<53:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8211/10070 [3:54:11<53:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8212/10070 [3:54:12<52:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8212/10070 [3:54:12<52:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8213/10070 [3:54:14<52:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8213/10070 [3:54:14<52:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8214/10070 [3:54:15<52:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8214/10070 [3:54:15<52:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8215/10070 [3:54:17<52:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8215/10070 [3:54:17<52:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8216/10070 [3:54:19<52:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8216/10070 [3:54:19<52:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8217/10070 [3:54:20<52:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8217/10070 [3:54:20<52:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8218/10070 [3:54:20<52:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8218/10070 [3:54:20<52:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8219/10070 [3:54:22<52:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8219/10070 [3:54:22<52:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8220/10070 [3:54:23<52:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8220/10070 [3:54:23<52:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8221/10070 [3:54:25<52:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8221/10070 [3:54:25<52:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8222/10070 [3:54:25<52:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8222/10070 [3:54:25<52:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8223/10070 [3:54:26<52:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8223/10070 [3:54:26<52:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8224/10070 [3:54:38<52:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8224/10070 [3:54:38<52:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8225/10070 [3:54:41<52:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8225/10070 [3:54:41<52:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8226/10070 [3:54:43<52:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8226/10070 [3:54:43<52:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8227/10070 [3:54:44<52:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8227/10070 [3:54:44<52:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8228/10070 [3:54:45<52:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8228/10070 [3:54:45<52:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8229/10070 [3:54:46<52:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8229/10070 [3:54:46<52:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8230/10070 [3:54:47<52:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8230/10070 [3:54:47<52:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8231/10070 [3:54:49<52:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8231/10070 [3:54:49<52:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8232/10070 [3:54:49<52:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8232/10070 [3:54:49<52:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8233/10070 [3:54:52<52:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8233/10070 [3:54:52<52:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8234/10070 [3:54:53<52:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8234/10070 [3:54:53<52:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8235/10070 [3:54:55<52:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8235/10070 [3:54:55<52:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8236/10070 [3:54:55<52:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8236/10070 [3:54:55<52:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8237/10070 [3:54:57<52:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8237/10070 [3:54:57<52:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|��| 8238/10070 [3:54:59<52:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8238/10070 [3:54:59<52:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8239/10070 [3:55:01<52:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8239/10070 [3:55:01<52:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8240/10070 [3:55:02<52:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8240/10070 [3:55:02<52:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8241/10070 [3:55:05<52:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8241/10070 [3:55:05<52:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8242/10070 [3:55:05<52:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8242/10070 [3:55:05<52:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8243/10070 [3:55:07<52:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8243/10070 [3:55:07<52:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8244/10070 [3:55:08<52:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8244/10070 [3:55:08<52:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8245/10070 [3:55:09<52:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8245/10070 [3:55:09<52:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8246/10070 [3:55:10<52:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8246/10070 [3:55:10<52:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8247/10070 [3:55:11<51:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8247/10070 [3:55:11<51:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8248/10070 [3:55:13<51:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8248/10070 [3:55:13<51:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8249/10070 [3:55:15<51:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8249/10070 [3:55:15<51:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8250/10070 [3:55:17<51:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8250/10070 [3:55:17<51:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8251/10070 [3:55:18<51:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8251/10070 [3:55:18<51:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8252/10070 [3:55:20<51:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8252/10070 [3:55:20<51:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8253/10070 [3:55:22<51:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8253/10070 [3:55:22<51:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8254/10070 [3:55:23<51:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8254/10070 [3:55:23<51:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8255/10070 [3:55:24<51:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8255/10070 [3:55:24<51:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8256/10070 [3:55:34<51:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8256/10070 [3:55:34<51:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8257/10070 [3:55:35<51:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8257/10070 [3:55:35<51:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8258/10070 [3:55:36<51:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8258/10070 [3:55:36<51:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8259/10070 [3:55:37<51:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8259/10070 [3:55:37<51:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8260/10070 [3:55:39<51:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8260/10070 [3:55:39<51:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8261/10070 [3:55:40<51:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8261/10070 [3:55:40<51:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8262/10070 [3:55:42<51:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8262/10070 [3:55:42<51:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8263/10070 [3:55:43<51:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8263/10070 [3:55:43<51:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8264/10070 [3:55:44<51:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8264/10070 [3:55:44<51:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8265/10070 [3:55:45<51:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8265/10070 [3:55:45<51:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8266/10070 [3:55:47<51:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8266/10070 [3:55:47<51:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8267/10070 [3:55:49<51:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8267/10070 [3:55:49<51:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8268/10070 [3:55:50<51:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8268/10070 [3:55:50<51:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8269/10070 [3:55:50<51:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8269/10070 [3:55:50<51:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8270/10070 [3:55:52<51:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8270/10070 [3:55:52<51:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8271/10070 [3:55:54<51:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8271/10070 [3:55:54<51:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8272/10070 [3:55:55<51:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8272/10070 [3:55:55<51:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8273/10070 [3:55:56<51:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8273/10070 [3:55:56<51:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8274/10070 [3:55:56<51:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8274/10070 [3:55:56<51:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8275/10070 [3:55:58<51:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8275/10070 [3:55:58<51:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8276/10070 [3:55:59<51:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8276/10070 [3:55:59<51:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8277/10070 [3:56:00<51:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8277/10070 [3:56:00<51:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8278/10070 [3:56:02<51:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8278/10070 [3:56:02<51:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8279/10070 [3:56:03<51:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8279/10070 [3:56:03<51:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8280/10070 [3:56:05<51:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8280/10070 [3:56:05<51:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8281/10070 [3:56:07<51:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8281/10070 [3:56:07<51:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8282/10070 [3:56:09<50:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8282/10070 [3:56:09<50:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8283/10070 [3:56:09<50:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8283/10070 [3:56:09<50:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8284/10070 [3:56:11<50:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8284/10070 [3:56:11<50:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8285/10070 [3:56:12<50:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8285/10070 [3:56:12<50:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8286/10070 [3:56:14<50:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8286/10070 [3:56:14<50:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8287/10070 [3:56:16<50:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8287/10070 [3:56:16<50:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8288/10070 [3:56:29<50:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8288/10070 [3:56:29<50:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8289/10070 [3:56:30<50:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8289/10070 [3:56:30<50:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8290/10070 [3:56:31<50:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8290/10070 [3:56:31<50:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8291/10070 [3:56:33<50:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8291/10070 [3:56:33<50:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8292/10070 [3:56:34<50:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8292/10070 [3:56:34<50:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8293/10070 [3:56:36<50:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8293/10070 [3:56:36<50:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8294/10070 [3:56:38<50:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8294/10070 [3:56:38<50:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8295/10070 [3:56:40<50:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8295/10070 [3:56:40<50:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8296/10070 [3:56:42<50:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8296/10070 [3:56:42<50:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8297/10070 [3:56:44<50:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8297/10070 [3:56:44<50:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8298/10070 [3:56:45<50:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8298/10070 [3:56:45<50:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8299/10070 [3:56:46<50:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8299/10070 [3:56:46<50:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8300/10070 [3:56:47<50:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8300/10070 [3:56:47<50:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8301/10070 [3:56:48<50:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8301/10070 [3:56:48<50:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8302/10070 [3:56:49<50:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8302/10070 [3:56:49<50:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8303/10070 [3:56:50<50:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8303/10070 [3:56:50<50:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8304/10070 [3:56:52<50:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8304/10070 [3:56:52<50:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8305/10070 [3:56:54<50:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8305/10070 [3:56:54<50:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8306/10070 [3:56:55<50:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8306/10070 [3:56:55<50:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  82%|▊| 8307/10070 [3:56:57<50:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  82%|▊| 8307/10070 [3:56:57<50:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8308/10070 [3:56:58<50:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8308/10070 [3:56:58<50:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8309/10070 [3:57:01<50:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8309/10070 [3:57:01<50:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8310/10070 [3:57:02<50:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8310/10070 [3:57:02<50:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8311/10070 [3:57:03<50:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8311/10070 [3:57:03<50:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8312/10070 [3:57:05<50:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8312/10070 [3:57:05<50:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8313/10070 [3:57:07<50:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8313/10070 [3:57:07<50:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8314/10070 [3:57:08<50:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8314/10070 [3:57:08<50:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8315/10070 [3:57:09<50:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8315/10070 [3:57:09<50:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8316/10070 [3:57:12<50:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8316/10070 [3:57:12<50:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8317/10070 [3:57:13<50:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8317/10070 [3:57:13<50:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8318/10070 [3:57:15<49:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8318/10070 [3:57:15<49:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8319/10070 [3:57:16<49:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8319/10070 [3:57:16<49:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8320/10070 [3:57:23<49:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8320/10070 [3:57:23<49:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8321/10070 [3:57:25<49:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8321/10070 [3:57:25<49:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8322/10070 [3:57:26<49:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8322/10070 [3:57:26<49:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8323/10070 [3:57:27<49:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8323/10070 [3:57:27<49:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8324/10070 [3:57:29<49:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8324/10070 [3:57:29<49:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8325/10070 [3:57:31<49:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8325/10070 [3:57:31<49:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8326/10070 [3:57:33<49:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8326/10070 [3:57:33<49:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8327/10070 [3:57:34<49:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8327/10070 [3:57:34<49:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8328/10070 [3:57:36<49:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8328/10070 [3:57:36<49:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8329/10070 [3:57:38<49:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8329/10070 [3:57:38<49:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8330/10070 [3:57:39<49:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8330/10070 [3:57:39<49:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8331/10070 [3:57:42<49:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8331/10070 [3:57:42<49:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8332/10070 [3:57:42<49:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8332/10070 [3:57:42<49:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8333/10070 [3:57:43<49:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8333/10070 [3:57:43<49:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8334/10070 [3:57:44<49:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8334/10070 [3:57:44<49:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8335/10070 [3:57:46<49:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8335/10070 [3:57:46<49:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8336/10070 [3:57:47<49:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8336/10070 [3:57:47<49:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8337/10070 [3:57:48<49:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8337/10070 [3:57:48<49:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8338/10070 [3:57:49<49:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8338/10070 [3:57:49<49:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8339/10070 [3:57:50<49:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8339/10070 [3:57:50<49:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8340/10070 [3:57:51<49:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8340/10070 [3:57:51<49:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8341/10070 [3:57:53<49:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8341/10070 [3:57:53<49:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8342/10070 [3:57:54<49:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8342/10070 [3:57:54<49:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8343/10070 [3:57:55<49:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8343/10070 [3:57:55<49:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8344/10070 [3:57:57<49:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8344/10070 [3:57:57<49:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8345/10070 [3:58:00<49:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8345/10070 [3:58:00<49:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8346/10070 [3:58:01<49:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8346/10070 [3:58:01<49:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8347/10070 [3:58:02<49:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8347/10070 [3:58:02<49:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8348/10070 [3:58:04<49:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8348/10070 [3:58:04<49:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8349/10070 [3:58:06<49:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8349/10070 [3:58:06<49:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8350/10070 [3:58:06<49:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8350/10070 [3:58:06<49:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8351/10070 [3:58:07<49:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8351/10070 [3:58:07<49:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8352/10070 [3:58:15<49:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8352/10070 [3:58:15<49:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8353/10070 [3:58:16<48:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8353/10070 [3:58:16<48:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8354/10070 [3:58:17<48:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8354/10070 [3:58:17<48:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8355/10070 [3:58:19<48:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8355/10070 [3:58:19<48:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8356/10070 [3:58:21<48:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8356/10070 [3:58:21<48:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8357/10070 [3:58:23<48:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8357/10070 [3:58:23<48:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8358/10070 [3:58:24<48:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8358/10070 [3:58:24<48:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8359/10070 [3:58:25<48:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8359/10070 [3:58:25<48:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8360/10070 [3:58:26<48:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8360/10070 [3:58:26<48:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8361/10070 [3:58:27<48:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8361/10070 [3:58:27<48:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8362/10070 [3:58:29<48:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8362/10070 [3:58:29<48:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8363/10070 [3:58:30<48:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8363/10070 [3:58:30<48:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8364/10070 [3:58:31<48:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8364/10070 [3:58:31<48:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8365/10070 [3:58:33<48:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8365/10070 [3:58:33<48:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8366/10070 [3:58:34<48:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8366/10070 [3:58:34<48:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8367/10070 [3:58:37<48:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8367/10070 [3:58:37<48:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8368/10070 [3:58:37<48:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8368/10070 [3:58:37<48:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8369/10070 [3:58:39<48:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8369/10070 [3:58:39<48:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8370/10070 [3:58:40<48:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8370/10070 [3:58:40<48:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8371/10070 [3:58:42<48:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8371/10070 [3:58:42<48:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8372/10070 [3:58:43<48:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8372/10070 [3:58:43<48:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8373/10070 [3:58:43<48:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8373/10070 [3:58:43<48:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8374/10070 [3:58:46<48:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8374/10070 [3:58:46<48:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8375/10070 [3:58:47<48:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8375/10070 [3:58:47<48:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8376/10070 [3:58:49<48:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8376/10070 [3:58:49<48:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8377/10070 [3:58:51<48:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8377/10070 [3:58:51<48:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8378/10070 [3:58:52<48:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8378/10070 [3:58:52<48:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8379/10070 [3:58:54<48:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8379/10070 [3:58:54<48:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8380/10070 [3:58:55<48:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8380/10070 [3:58:55<48:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8381/10070 [3:58:56<48:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8381/10070 [3:58:56<48:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8382/10070 [3:58:58<48:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8382/10070 [3:58:58<48:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8383/10070 [3:58:59<48:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8383/10070 [3:58:59<48:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8384/10070 [3:59:10<48:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8384/10070 [3:59:10<48:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8385/10070 [3:59:10<48:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8385/10070 [3:59:10<48:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8386/10070 [3:59:12<48:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8386/10070 [3:59:12<48:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8387/10070 [3:59:12<48:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8387/10070 [3:59:12<48:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8388/10070 [3:59:14<47:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8388/10070 [3:59:14<47:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8389/10070 [3:59:16<47:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8389/10070 [3:59:16<47:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8390/10070 [3:59:16<47:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8390/10070 [3:59:16<47:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8391/10070 [3:59:17<47:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8391/10070 [3:59:17<47:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8392/10070 [3:59:19<47:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8392/10070 [3:59:19<47:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8393/10070 [3:59:19<47:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|���| 8393/10070 [3:59:19<47:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8394/10070 [3:59:22<47:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8394/10070 [3:59:22<47:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8395/10070 [3:59:23<47:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8395/10070 [3:59:23<47:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8396/10070 [3:59:24<47:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8396/10070 [3:59:24<47:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8397/10070 [3:59:24<47:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8397/10070 [3:59:24<47:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8398/10070 [3:59:25<47:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8398/10070 [3:59:25<47:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8399/10070 [3:59:27<47:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8399/10070 [3:59:27<47:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8400/10070 [3:59:28<47:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8400/10070 [3:59:28<47:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8401/10070 [3:59:29<47:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8401/10070 [3:59:29<47:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8402/10070 [3:59:31<47:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8402/10070 [3:59:31<47:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8403/10070 [3:59:33<47:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8403/10070 [3:59:33<47:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8404/10070 [3:59:35<47:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8404/10070 [3:59:35<47:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8405/10070 [3:59:37<47:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8405/10070 [3:59:37<47:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8406/10070 [3:59:38<47:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8406/10070 [3:59:38<47:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8407/10070 [3:59:38<47:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8407/10070 [3:59:38<47:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  83%|▊| 8408/10070 [3:59:40<47:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  83%|▊| 8408/10070 [3:59:40<47:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8409/10070 [3:59:40<47:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8409/10070 [3:59:40<47:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8410/10070 [3:59:43<47:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8410/10070 [3:59:43<47:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8411/10070 [3:59:44<47:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8411/10070 [3:59:44<47:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8412/10070 [3:59:46<47:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8412/10070 [3:59:46<47:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8413/10070 [3:59:47<47:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8413/10070 [3:59:47<47:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8414/10070 [3:59:50<47:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8414/10070 [3:59:50<47:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8415/10070 [3:59:51<47:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8415/10070 [3:59:51<47:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8416/10070 [4:00:04<47:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8416/10070 [4:00:04<47:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8417/10070 [4:00:05<47:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8417/10070 [4:00:05<47:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8418/10070 [4:00:06<47:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8418/10070 [4:00:06<47:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8419/10070 [4:00:08<47:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8419/10070 [4:00:08<47:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8420/10070 [4:00:10<47:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8420/10070 [4:00:10<47:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8421/10070 [4:00:10<47:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8421/10070 [4:00:10<47:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8422/10070 [4:00:11<47:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8422/10070 [4:00:11<47:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8423/10070 [4:00:13<46:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8423/10070 [4:00:13<46:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8424/10070 [4:00:14<46:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8424/10070 [4:00:14<46:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8425/10070 [4:00:15<46:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8425/10070 [4:00:15<46:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8426/10070 [4:00:16<46:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8426/10070 [4:00:16<46:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8427/10070 [4:00:17<46:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8427/10070 [4:00:17<46:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8428/10070 [4:00:19<46:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8428/10070 [4:00:19<46:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8429/10070 [4:00:21<46:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8429/10070 [4:00:21<46:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8430/10070 [4:00:22<46:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8430/10070 [4:00:22<46:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8431/10070 [4:00:24<46:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8431/10070 [4:00:24<46:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8432/10070 [4:00:25<46:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8432/10070 [4:00:25<46:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8433/10070 [4:00:26<46:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8433/10070 [4:00:26<46:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8434/10070 [4:00:27<46:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8434/10070 [4:00:27<46:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8435/10070 [4:00:29<46:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8435/10070 [4:00:30<46:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8436/10070 [4:00:31<46:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8436/10070 [4:00:31<46:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8437/10070 [4:00:33<46:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8437/10070 [4:00:33<46:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8438/10070 [4:00:34<46:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8438/10070 [4:00:34<46:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8439/10070 [4:00:36<46:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8439/10070 [4:00:36<46:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8440/10070 [4:00:37<46:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8440/10070 [4:00:37<46:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8441/10070 [4:00:39<46:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8441/10070 [4:00:39<46:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8442/10070 [4:00:41<46:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8442/10070 [4:00:41<46:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8443/10070 [4:00:42<46:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8443/10070 [4:00:42<46:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8444/10070 [4:00:43<46:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8444/10070 [4:00:43<46:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8445/10070 [4:00:44<46:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8445/10070 [4:00:44<46:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8446/10070 [4:00:45<46:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8446/10070 [4:00:45<46:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8447/10070 [4:00:48<46:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8447/10070 [4:00:48<46:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8448/10070 [4:00:56<46:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8448/10070 [4:00:56<46:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8449/10070 [4:00:58<46:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8449/10070 [4:00:58<46:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8450/10070 [4:01:00<46:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8450/10070 [4:01:00<46:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8451/10070 [4:01:01<46:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8451/10070 [4:01:01<46:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8452/10070 [4:01:01<46:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8452/10070 [4:01:01<46:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8453/10070 [4:01:04<46:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8453/10070 [4:01:04<46:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8454/10070 [4:01:05<46:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8454/10070 [4:01:05<46:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8455/10070 [4:01:06<46:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8455/10070 [4:01:06<46:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8456/10070 [4:01:07<46:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8456/10070 [4:01:07<46:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8457/10070 [4:01:09<45:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8457/10070 [4:01:09<45:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8458/10070 [4:01:11<45:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8458/10070 [4:01:11<45:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8459/10070 [4:01:11<45:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8459/10070 [4:01:11<45:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8460/10070 [4:01:14<45:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8460/10070 [4:01:14<45:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8461/10070 [4:01:16<45:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8461/10070 [4:01:16<45:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8462/10070 [4:01:16<45:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8462/10070 [4:01:16<45:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8463/10070 [4:01:18<45:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8463/10070 [4:01:18<45:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8464/10070 [4:01:19<45:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8464/10070 [4:01:19<45:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8465/10070 [4:01:20<45:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8465/10070 [4:01:20<45:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8466/10070 [4:01:22<45:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8466/10070 [4:01:22<45:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8467/10070 [4:01:24<45:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8467/10070 [4:01:24<45:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8468/10070 [4:01:26<45:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8468/10070 [4:01:26<45:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8469/10070 [4:01:27<45:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8469/10070 [4:01:27<45:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8470/10070 [4:01:27<45:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8470/10070 [4:01:27<45:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8471/10070 [4:01:28<45:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8471/10070 [4:01:28<45:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8472/10070 [4:01:29<45:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8472/10070 [4:01:29<45:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8473/10070 [4:01:30<45:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8473/10070 [4:01:30<45:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8474/10070 [4:01:31<45:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8474/10070 [4:01:31<45:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8475/10070 [4:01:32<45:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8475/10070 [4:01:32<45:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8476/10070 [4:01:35<45:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8476/10070 [4:01:35<45:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8477/10070 [4:01:36<45:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8477/10070 [4:01:36<45:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8478/10070 [4:01:38<45:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8478/10070 [4:01:38<45:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8479/10070 [4:01:39<45:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8479/10070 [4:01:39<45:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8480/10070 [4:01:48<45:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8480/10070 [4:01:48<45:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8481/10070 [4:01:49<45:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8481/10070 [4:01:49<45:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8482/10070 [4:01:50<45:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8482/10070 [4:01:50<45:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8483/10070 [4:01:52<45:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8483/10070 [4:01:52<45:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8484/10070 [4:01:54<45:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8484/10070 [4:01:54<45:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8485/10070 [4:01:55<45:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8485/10070 [4:01:55<45:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8486/10070 [4:01:57<45:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8486/10070 [4:01:57<45:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8487/10070 [4:01:59<45:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8487/10070 [4:01:59<45:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8488/10070 [4:02:00<45:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8488/10070 [4:02:00<45:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8489/10070 [4:02:01<45:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8489/10070 [4:02:01<45:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8490/10070 [4:02:01<45:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8490/10070 [4:02:01<45:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8491/10070 [4:02:03<45:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8491/10070 [4:02:03<45:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8492/10070 [4:02:05<44:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8492/10070 [4:02:05<44:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8493/10070 [4:02:06<44:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8493/10070 [4:02:06<44:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8494/10070 [4:02:08<44:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8494/10070 [4:02:08<44:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8495/10070 [4:02:10<44:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8495/10070 [4:02:10<44:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8496/10070 [4:02:12<44:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8496/10070 [4:02:12<44:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8497/10070 [4:02:14<44:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8497/10070 [4:02:14<44:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8498/10070 [4:02:16<44:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8498/10070 [4:02:16<44:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8499/10070 [4:02:18<44:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8499/10070 [4:02:18<44:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8500/10070 [4:02:19<44:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8500/10070 [4:02:19<44:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8501/10070 [4:02:20<44:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8501/10070 [4:02:20<44:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8502/10070 [4:02:22<44:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8502/10070 [4:02:22<44:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8503/10070 [4:02:24<44:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8503/10070 [4:02:24<44:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8504/10070 [4:02:26<44:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8504/10070 [4:02:26<44:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8505/10070 [4:02:27<44:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8505/10070 [4:02:27<44:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8506/10070 [4:02:28<44:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8506/10070 [4:02:28<44:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8507/10070 [4:02:30<44:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8507/10070 [4:02:30<44:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8508/10070 [4:02:31<44:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  84%|▊| 8508/10070 [4:02:31<44:31,  1.71s/it, v_num=tif6, train/loss=8."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  84%|▊| 8509/10070 [4:02:32<44:29,  1.71s/it, v_num=tif6, train/loss=8.\r",
-      "Epoch 0:  84%|▊| 8509/10070 [4:02:32<44:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8510/10070 [4:02:34<44:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8510/10070 [4:02:34<44:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8511/10070 [4:02:35<44:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8511/10070 [4:02:35<44:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8512/10070 [4:02:43<44:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8512/10070 [4:02:43<44:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8513/10070 [4:02:44<44:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8513/10070 [4:02:44<44:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8514/10070 [4:02:46<44:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8514/10070 [4:02:46<44:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8515/10070 [4:02:46<44:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8515/10070 [4:02:46<44:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8516/10070 [4:02:49<44:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8516/10070 [4:02:49<44:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8517/10070 [4:02:51<44:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8517/10070 [4:02:51<44:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8518/10070 [4:02:53<44:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8518/10070 [4:02:53<44:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8519/10070 [4:02:55<44:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8519/10070 [4:02:55<44:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8520/10070 [4:02:57<44:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8520/10070 [4:02:57<44:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8521/10070 [4:02:58<44:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8521/10070 [4:02:58<44:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8522/10070 [4:03:00<44:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8522/10070 [4:03:00<44:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8523/10070 [4:03:02<44:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8523/10070 [4:03:02<44:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8524/10070 [4:03:04<44:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8524/10070 [4:03:04<44:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8525/10070 [4:03:05<44:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8525/10070 [4:03:05<44:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8526/10070 [4:03:06<44:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8526/10070 [4:03:06<44:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8527/10070 [4:03:08<43:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8527/10070 [4:03:08<43:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8528/10070 [4:03:09<43:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8528/10070 [4:03:09<43:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8529/10070 [4:03:11<43:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8529/10070 [4:03:11<43:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8530/10070 [4:03:12<43:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8530/10070 [4:03:12<43:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8531/10070 [4:03:13<43:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8531/10070 [4:03:13<43:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8532/10070 [4:03:15<43:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8532/10070 [4:03:15<43:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8533/10070 [4:03:16<43:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8533/10070 [4:03:16<43:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8534/10070 [4:03:19<43:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8534/10070 [4:03:19<43:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8535/10070 [4:03:20<43:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8535/10070 [4:03:20<43:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8536/10070 [4:03:21<43:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8536/10070 [4:03:21<43:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8537/10070 [4:03:22<43:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8537/10070 [4:03:22<43:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8538/10070 [4:03:23<43:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8538/10070 [4:03:23<43:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8539/10070 [4:03:24<43:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8539/10070 [4:03:24<43:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8540/10070 [4:03:25<43:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8540/10070 [4:03:25<43:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8541/10070 [4:03:27<43:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8541/10070 [4:03:27<43:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8542/10070 [4:03:28<43:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8542/10070 [4:03:28<43:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8543/10070 [4:03:31<43:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8543/10070 [4:03:31<43:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8544/10070 [4:03:38<43:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8544/10070 [4:03:38<43:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8545/10070 [4:03:39<43:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8545/10070 [4:03:39<43:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8546/10070 [4:03:40<43:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8546/10070 [4:03:40<43:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8547/10070 [4:03:42<43:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8547/10070 [4:03:42<43:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8548/10070 [4:03:44<43:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8548/10070 [4:03:44<43:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8549/10070 [4:03:46<43:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8549/10070 [4:03:46<43:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8550/10070 [4:03:48<43:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8550/10070 [4:03:48<43:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8551/10070 [4:03:49<43:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8551/10070 [4:03:49<43:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8552/10070 [4:03:51<43:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8552/10070 [4:03:51<43:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8553/10070 [4:03:52<43:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8553/10070 [4:03:52<43:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8554/10070 [4:03:54<43:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8554/10070 [4:03:54<43:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8555/10070 [4:03:55<43:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8555/10070 [4:03:55<43:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8556/10070 [4:03:56<43:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8556/10070 [4:03:56<43:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8557/10070 [4:03:57<43:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8557/10070 [4:03:57<43:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8558/10070 [4:03:58<43:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8558/10070 [4:03:58<43:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8559/10070 [4:04:00<43:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8559/10070 [4:04:00<43:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8560/10070 [4:04:02<43:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8560/10070 [4:04:02<43:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8561/10070 [4:04:03<43:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8561/10070 [4:04:03<43:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8562/10070 [4:04:04<42:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8562/10070 [4:04:04<42:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8563/10070 [4:04:06<42:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8563/10070 [4:04:06<42:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8564/10070 [4:04:07<42:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8564/10070 [4:04:07<42:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8565/10070 [4:04:08<42:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8565/10070 [4:04:08<42:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8566/10070 [4:04:09<42:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8566/10070 [4:04:09<42:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8567/10070 [4:04:10<42:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8567/10070 [4:04:10<42:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8568/10070 [4:04:12<42:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8568/10070 [4:04:12<42:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8569/10070 [4:04:14<42:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8569/10070 [4:04:14<42:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8570/10070 [4:04:17<42:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8570/10070 [4:04:17<42:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8571/10070 [4:04:18<42:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8571/10070 [4:04:18<42:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8572/10070 [4:04:19<42:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8572/10070 [4:04:19<42:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8573/10070 [4:04:20<42:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8573/10070 [4:04:20<42:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8574/10070 [4:04:22<42:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8574/10070 [4:04:22<42:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8575/10070 [4:04:24<42:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8575/10070 [4:04:24<42:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8576/10070 [4:04:32<42:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8576/10070 [4:04:32<42:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8577/10070 [4:04:34<42:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8577/10070 [4:04:34<42:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8578/10070 [4:04:35<42:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8578/10070 [4:04:35<42:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8579/10070 [4:04:36<42:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8579/10070 [4:04:36<42:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8580/10070 [4:04:37<42:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8580/10070 [4:04:37<42:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8581/10070 [4:04:38<42:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8581/10070 [4:04:38<42:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8582/10070 [4:04:38<42:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8582/10070 [4:04:38<42:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8583/10070 [4:04:40<42:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8583/10070 [4:04:40<42:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8584/10070 [4:04:41<42:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8584/10070 [4:04:41<42:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8585/10070 [4:04:43<42:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8585/10070 [4:04:43<42:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8586/10070 [4:04:44<42:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8586/10070 [4:04:44<42:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8587/10070 [4:04:45<42:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8587/10070 [4:04:45<42:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8588/10070 [4:04:47<42:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8588/10070 [4:04:47<42:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8589/10070 [4:04:49<42:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8589/10070 [4:04:49<42:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8590/10070 [4:04:49<42:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8590/10070 [4:04:49<42:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8591/10070 [4:04:50<42:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8591/10070 [4:04:50<42:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8592/10070 [4:04:51<42:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8592/10070 [4:04:51<42:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8593/10070 [4:04:53<42:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8593/10070 [4:04:53<42:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8594/10070 [4:04:54<42:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8594/10070 [4:04:54<42:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8595/10070 [4:04:55<42:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8595/10070 [4:04:55<42:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8596/10070 [4:04:57<42:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8596/10070 [4:04:57<42:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8597/10070 [4:04:58<41:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8597/10070 [4:04:58<41:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8598/10070 [4:05:00<41:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8598/10070 [4:05:00<41:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8599/10070 [4:05:02<41:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8599/10070 [4:05:02<41:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8600/10070 [4:05:04<41:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8600/10070 [4:05:04<41:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8601/10070 [4:05:05<41:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8601/10070 [4:05:05<41:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8602/10070 [4:05:07<41:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8602/10070 [4:05:07<41:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8603/10070 [4:05:09<41:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8603/10070 [4:05:09<41:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8604/10070 [4:05:09<41:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8604/10070 [4:05:09<41:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8605/10070 [4:05:10<41:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8605/10070 [4:05:10<41:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8606/10070 [4:05:11<41:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8606/10070 [4:05:11<41:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8607/10070 [4:05:11<41:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8607/10070 [4:05:11<41:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8608/10070 [4:05:24<41:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8608/10070 [4:05:24<41:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  85%|▊| 8609/10070 [4:05:24<41:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  85%|▊| 8609/10070 [4:05:24<41:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8610/10070 [4:05:26<41:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8610/10070 [4:05:26<41:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8611/10070 [4:05:27<41:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8611/10070 [4:05:27<41:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8612/10070 [4:05:29<41:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8612/10070 [4:05:29<41:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8613/10070 [4:05:31<41:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8613/10070 [4:05:31<41:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8614/10070 [4:05:32<41:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8614/10070 [4:05:32<41:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8615/10070 [4:05:35<41:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8615/10070 [4:05:35<41:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8616/10070 [4:05:36<41:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8616/10070 [4:05:36<41:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8617/10070 [4:05:37<41:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8617/10070 [4:05:37<41:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8618/10070 [4:05:39<41:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8618/10070 [4:05:39<41:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8619/10070 [4:05:40<41:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8619/10070 [4:05:40<41:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8620/10070 [4:05:41<41:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8620/10070 [4:05:41<41:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8621/10070 [4:05:42<41:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8621/10070 [4:05:42<41:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8622/10070 [4:05:43<41:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8622/10070 [4:05:43<41:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8623/10070 [4:05:45<41:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8623/10070 [4:05:45<41:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8624/10070 [4:05:45<41:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8624/10070 [4:05:45<41:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8625/10070 [4:05:46<41:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8625/10070 [4:05:46<41:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8626/10070 [4:05:48<41:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8626/10070 [4:05:48<41:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8627/10070 [4:05:48<41:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8627/10070 [4:05:48<41:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8628/10070 [4:05:50<41:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8628/10070 [4:05:50<41:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8629/10070 [4:05:50<41:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8629/10070 [4:05:50<41:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8630/10070 [4:05:52<41:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8630/10070 [4:05:52<41:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8631/10070 [4:05:54<40:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8631/10070 [4:05:54<40:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8632/10070 [4:05:56<40:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8632/10070 [4:05:56<40:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8633/10070 [4:05:57<40:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8633/10070 [4:05:57<40:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8634/10070 [4:05:59<40:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8634/10070 [4:05:59<40:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8635/10070 [4:06:00<40:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8635/10070 [4:06:00<40:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8636/10070 [4:06:01<40:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8636/10070 [4:06:01<40:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8637/10070 [4:06:02<40:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8637/10070 [4:06:02<40:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8638/10070 [4:06:03<40:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8638/10070 [4:06:03<40:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8639/10070 [4:06:03<40:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8639/10070 [4:06:03<40:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8640/10070 [4:06:17<40:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8640/10070 [4:06:17<40:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8641/10070 [4:06:17<40:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8641/10070 [4:06:17<40:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8642/10070 [4:06:20<40:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8642/10070 [4:06:20<40:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8643/10070 [4:06:20<40:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8643/10070 [4:06:20<40:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8644/10070 [4:06:21<40:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8644/10070 [4:06:21<40:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8645/10070 [4:06:22<40:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8645/10070 [4:06:22<40:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8646/10070 [4:06:23<40:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8646/10070 [4:06:23<40:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8647/10070 [4:06:24<40:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8647/10070 [4:06:24<40:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8648/10070 [4:06:25<40:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8648/10070 [4:06:25<40:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8649/10070 [4:06:25<40:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8649/10070 [4:06:25<40:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8650/10070 [4:06:27<40:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8650/10070 [4:06:27<40:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8651/10070 [4:06:28<40:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8651/10070 [4:06:28<40:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8652/10070 [4:06:30<40:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8652/10070 [4:06:30<40:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8653/10070 [4:06:32<40:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8653/10070 [4:06:32<40:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8654/10070 [4:06:33<40:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8654/10070 [4:06:33<40:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8655/10070 [4:06:34<40:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8655/10070 [4:06:34<40:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8656/10070 [4:06:36<40:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8656/10070 [4:06:36<40:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8657/10070 [4:06:36<40:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8657/10070 [4:06:36<40:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8658/10070 [4:06:38<40:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8658/10070 [4:06:38<40:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8659/10070 [4:06:39<40:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8659/10070 [4:06:39<40:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8660/10070 [4:06:40<40:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8660/10070 [4:06:40<40:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8661/10070 [4:06:41<40:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8661/10070 [4:06:41<40:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8662/10070 [4:06:42<40:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8662/10070 [4:06:42<40:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8663/10070 [4:06:43<40:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8663/10070 [4:06:43<40:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8664/10070 [4:06:44<40:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8664/10070 [4:06:44<40:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8665/10070 [4:06:46<40:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8665/10070 [4:06:46<40:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8666/10070 [4:06:46<39:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8666/10070 [4:06:46<39:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8667/10070 [4:06:48<39:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8667/10070 [4:06:48<39:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8668/10070 [4:06:50<39:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8668/10070 [4:06:50<39:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8669/10070 [4:06:51<39:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8669/10070 [4:06:51<39:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8670/10070 [4:06:52<39:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8670/10070 [4:06:52<39:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8671/10070 [4:06:54<39:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8671/10070 [4:06:54<39:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8672/10070 [4:07:14<39:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8672/10070 [4:07:14<39:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8673/10070 [4:07:14<39:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8673/10070 [4:07:14<39:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8674/10070 [4:07:16<39:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8674/10070 [4:07:16<39:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8675/10070 [4:07:16<39:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8675/10070 [4:07:16<39:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8676/10070 [4:07:18<39:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8676/10070 [4:07:18<39:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8677/10070 [4:07:20<39:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8677/10070 [4:07:20<39:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8678/10070 [4:07:22<39:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8678/10070 [4:07:22<39:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8679/10070 [4:07:23<39:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8679/10070 [4:07:23<39:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8680/10070 [4:07:24<39:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8680/10070 [4:07:24<39:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8681/10070 [4:07:25<39:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8681/10070 [4:07:25<39:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8682/10070 [4:07:26<39:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8682/10070 [4:07:26<39:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8683/10070 [4:07:28<39:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8683/10070 [4:07:28<39:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8684/10070 [4:07:29<39:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8684/10070 [4:07:29<39:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8685/10070 [4:07:31<39:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8685/10070 [4:07:31<39:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8686/10070 [4:07:33<39:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8686/10070 [4:07:33<39:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8687/10070 [4:07:35<39:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8687/10070 [4:07:35<39:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8688/10070 [4:07:36<39:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8688/10070 [4:07:36<39:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8689/10070 [4:07:38<39:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8689/10070 [4:07:38<39:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8690/10070 [4:07:39<39:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8690/10070 [4:07:39<39:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8691/10070 [4:07:40<39:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8691/10070 [4:07:40<39:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8692/10070 [4:07:41<39:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8692/10070 [4:07:41<39:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8693/10070 [4:07:41<39:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8693/10070 [4:07:41<39:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8694/10070 [4:07:42<39:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8694/10070 [4:07:42<39:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8695/10070 [4:07:43<39:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8695/10070 [4:07:43<39:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8696/10070 [4:07:44<39:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8696/10070 [4:07:44<39:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8697/10070 [4:07:46<39:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8697/10070 [4:07:46<39:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8698/10070 [4:07:48<39:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8698/10070 [4:07:48<39:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8699/10070 [4:07:50<39:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8699/10070 [4:07:50<39:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8700/10070 [4:07:52<39:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8700/10070 [4:07:52<39:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8701/10070 [4:07:54<39:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8701/10070 [4:07:54<39:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8702/10070 [4:07:55<38:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8702/10070 [4:07:55<38:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8703/10070 [4:07:55<38:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8703/10070 [4:07:55<38:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8704/10070 [4:08:04<38:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8704/10070 [4:08:04<38:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8705/10070 [4:08:05<38:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8705/10070 [4:08:05<38:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8706/10070 [4:08:07<38:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8706/10070 [4:08:07<38:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8707/10070 [4:08:10<38:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8707/10070 [4:08:10<38:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8708/10070 [4:08:11<38:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8708/10070 [4:08:11<38:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8709/10070 [4:08:12<38:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8709/10070 [4:08:12<38:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  86%|▊| 8710/10070 [4:08:14<38:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  86%|▊| 8710/10070 [4:08:14<38:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8711/10070 [4:08:15<38:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8711/10070 [4:08:15<38:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8712/10070 [4:08:15<38:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8712/10070 [4:08:15<38:41,  1.71s/it, v_num=tif6, train/loss=7."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8713/10070 [4:08:18<38:40,  1.71s/it, v_num=tif6, train/loss=7.\r",
-      "Epoch 0:  87%|▊| 8713/10070 [4:08:18<38:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8714/10070 [4:08:18<38:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8714/10070 [4:08:18<38:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8715/10070 [4:08:19<38:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8715/10070 [4:08:19<38:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8716/10070 [4:08:20<38:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8716/10070 [4:08:20<38:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8717/10070 [4:08:21<38:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8717/10070 [4:08:21<38:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8718/10070 [4:08:22<38:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8718/10070 [4:08:22<38:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8719/10070 [4:08:23<38:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8719/10070 [4:08:23<38:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8720/10070 [4:08:24<38:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8720/10070 [4:08:24<38:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8721/10070 [4:08:25<38:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8721/10070 [4:08:25<38:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8722/10070 [4:08:25<38:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8722/10070 [4:08:25<38:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8723/10070 [4:08:26<38:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8723/10070 [4:08:26<38:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8724/10070 [4:08:27<38:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8724/10070 [4:08:27<38:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8725/10070 [4:08:28<38:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8725/10070 [4:08:28<38:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8726/10070 [4:08:29<38:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8726/10070 [4:08:29<38:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8727/10070 [4:08:31<38:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8727/10070 [4:08:31<38:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8728/10070 [4:08:33<38:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8728/10070 [4:08:33<38:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8729/10070 [4:08:34<38:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8729/10070 [4:08:34<38:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8730/10070 [4:08:35<38:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8730/10070 [4:08:35<38:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8731/10070 [4:08:38<38:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8731/10070 [4:08:38<38:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8732/10070 [4:08:39<38:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8732/10070 [4:08:39<38:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8733/10070 [4:08:40<38:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8733/10070 [4:08:40<38:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8734/10070 [4:08:42<38:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8734/10070 [4:08:42<38:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8735/10070 [4:08:43<38:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8735/10070 [4:08:43<38:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8736/10070 [4:08:56<38:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8736/10070 [4:08:56<38:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8737/10070 [4:08:59<37:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8737/10070 [4:08:59<37:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8738/10070 [4:09:00<37:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8738/10070 [4:09:00<37:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8739/10070 [4:09:03<37:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8739/10070 [4:09:03<37:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8740/10070 [4:09:04<37:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8740/10070 [4:09:04<37:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8741/10070 [4:09:06<37:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8741/10070 [4:09:06<37:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8742/10070 [4:09:08<37:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8742/10070 [4:09:08<37:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8743/10070 [4:09:09<37:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8743/10070 [4:09:09<37:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8744/10070 [4:09:10<37:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8744/10070 [4:09:10<37:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8745/10070 [4:09:12<37:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8745/10070 [4:09:12<37:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8746/10070 [4:09:13<37:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8746/10070 [4:09:13<37:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8747/10070 [4:09:15<37:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8747/10070 [4:09:15<37:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8748/10070 [4:09:17<37:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8748/10070 [4:09:17<37:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8749/10070 [4:09:18<37:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8749/10070 [4:09:18<37:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8750/10070 [4:09:20<37:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8750/10070 [4:09:20<37:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8751/10070 [4:09:22<37:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8751/10070 [4:09:22<37:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8752/10070 [4:09:24<37:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8752/10070 [4:09:24<37:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8753/10070 [4:09:25<37:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8753/10070 [4:09:25<37:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8754/10070 [4:09:26<37:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8754/10070 [4:09:26<37:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8755/10070 [4:09:27<37:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8755/10070 [4:09:27<37:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8756/10070 [4:09:29<37:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8756/10070 [4:09:29<37:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8757/10070 [4:09:31<37:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8757/10070 [4:09:31<37:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8758/10070 [4:09:33<37:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8758/10070 [4:09:33<37:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8759/10070 [4:09:35<37:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8759/10070 [4:09:35<37:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8760/10070 [4:09:36<37:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8760/10070 [4:09:36<37:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8761/10070 [4:09:38<37:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8761/10070 [4:09:38<37:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8762/10070 [4:09:39<37:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8762/10070 [4:09:39<37:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8763/10070 [4:09:39<37:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8763/10070 [4:09:39<37:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8764/10070 [4:09:41<37:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8764/10070 [4:09:41<37:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8765/10070 [4:09:42<37:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8765/10070 [4:09:42<37:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8766/10070 [4:09:44<37:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8766/10070 [4:09:44<37:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8767/10070 [4:09:46<37:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8767/10070 [4:09:46<37:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8768/10070 [4:09:53<37:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8768/10070 [4:09:53<37:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8769/10070 [4:09:55<37:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8769/10070 [4:09:55<37:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8770/10070 [4:09:57<37:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8770/10070 [4:09:57<37:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8771/10070 [4:09:57<37:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8771/10070 [4:09:57<37:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8772/10070 [4:09:58<36:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8772/10070 [4:09:58<36:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8773/10070 [4:10:00<36:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8773/10070 [4:10:00<36:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8774/10070 [4:10:00<36:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8774/10070 [4:10:00<36:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8775/10070 [4:10:02<36:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8775/10070 [4:10:02<36:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8776/10070 [4:10:03<36:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8776/10070 [4:10:03<36:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8777/10070 [4:10:04<36:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8777/10070 [4:10:04<36:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8778/10070 [4:10:07<36:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8778/10070 [4:10:07<36:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8779/10070 [4:10:08<36:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8779/10070 [4:10:08<36:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8780/10070 [4:10:11<36:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8780/10070 [4:10:11<36:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8781/10070 [4:10:11<36:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8781/10070 [4:10:11<36:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8782/10070 [4:10:13<36:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8782/10070 [4:10:13<36:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8783/10070 [4:10:15<36:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8783/10070 [4:10:15<36:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8784/10070 [4:10:17<36:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8784/10070 [4:10:17<36:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8785/10070 [4:10:19<36:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8785/10070 [4:10:19<36:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8786/10070 [4:10:22<36:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8786/10070 [4:10:22<36:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8787/10070 [4:10:23<36:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8787/10070 [4:10:23<36:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8788/10070 [4:10:25<36:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8788/10070 [4:10:25<36:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8789/10070 [4:10:27<36:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8789/10070 [4:10:27<36:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8790/10070 [4:10:28<36:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8790/10070 [4:10:28<36:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8791/10070 [4:10:30<36:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8791/10070 [4:10:30<36:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8792/10070 [4:10:31<36:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8792/10070 [4:10:31<36:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8793/10070 [4:10:32<36:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8793/10070 [4:10:32<36:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8794/10070 [4:10:32<36:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8794/10070 [4:10:32<36:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8795/10070 [4:10:34<36:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8795/10070 [4:10:34<36:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8796/10070 [4:10:35<36:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8796/10070 [4:10:35<36:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8797/10070 [4:10:35<36:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8797/10070 [4:10:35<36:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8798/10070 [4:10:38<36:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8798/10070 [4:10:38<36:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8799/10070 [4:10:40<36:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8799/10070 [4:10:40<36:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8800/10070 [4:10:47<36:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8800/10070 [4:10:47<36:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8801/10070 [4:11:12<36:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8801/10070 [4:11:12<36:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8802/10070 [4:11:14<36:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8802/10070 [4:11:14<36:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8803/10070 [4:11:15<36:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8803/10070 [4:11:15<36:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8804/10070 [4:11:17<36:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8804/10070 [4:11:17<36:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8805/10070 [4:11:18<36:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8805/10070 [4:11:18<36:06,  1.71s/it, v_num=tif6, train/loss=9."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8806/10070 [4:11:19<36:04,  1.71s/it, v_num=tif6, train/loss=9.\r",
-      "Epoch 0:  87%|▊| 8806/10070 [4:11:19<36:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8807/10070 [4:11:20<36:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8807/10070 [4:11:20<36:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8808/10070 [4:11:22<36:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8808/10070 [4:11:22<36:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8809/10070 [4:11:23<35:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8809/10070 [4:11:23<35:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8810/10070 [4:11:24<35:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8810/10070 [4:11:24<35:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  87%|▊| 8811/10070 [4:11:26<35:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  87%|▊| 8811/10070 [4:11:26<35:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8812/10070 [4:11:27<35:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8812/10070 [4:11:27<35:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8813/10070 [4:11:29<35:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8813/10070 [4:11:29<35:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8814/10070 [4:11:30<35:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8814/10070 [4:11:30<35:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8815/10070 [4:11:32<35:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8815/10070 [4:11:32<35:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8816/10070 [4:11:34<35:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8816/10070 [4:11:34<35:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8817/10070 [4:11:36<35:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8817/10070 [4:11:36<35:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8818/10070 [4:11:37<35:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8818/10070 [4:11:37<35:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8819/10070 [4:11:38<35:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8819/10070 [4:11:38<35:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8820/10070 [4:11:39<35:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8820/10070 [4:11:39<35:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8821/10070 [4:11:41<35:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8821/10070 [4:11:41<35:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8822/10070 [4:11:44<35:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8822/10070 [4:11:44<35:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8823/10070 [4:11:44<35:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8823/10070 [4:11:44<35:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8824/10070 [4:11:45<35:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8824/10070 [4:11:45<35:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8825/10070 [4:11:46<35:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8825/10070 [4:11:46<35:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8826/10070 [4:11:47<35:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8826/10070 [4:11:47<35:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8827/10070 [4:11:49<35:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8827/10070 [4:11:49<35:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8828/10070 [4:11:50<35:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8828/10070 [4:11:50<35:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8829/10070 [4:11:51<35:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8829/10070 [4:11:51<35:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8830/10070 [4:11:52<35:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8830/10070 [4:11:52<35:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8831/10070 [4:11:53<35:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8831/10070 [4:11:53<35:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8832/10070 [4:12:04<35:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8832/10070 [4:12:04<35:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8833/10070 [4:12:05<35:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8833/10070 [4:12:05<35:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8834/10070 [4:12:07<35:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8834/10070 [4:12:07<35:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8835/10070 [4:12:09<35:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8835/10070 [4:12:09<35:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8836/10070 [4:12:09<35:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8836/10070 [4:12:09<35:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8837/10070 [4:12:11<35:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8837/10070 [4:12:11<35:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8838/10070 [4:12:12<35:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8838/10070 [4:12:12<35:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8839/10070 [4:12:14<35:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8839/10070 [4:12:14<35:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8840/10070 [4:12:14<35:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8840/10070 [4:12:14<35:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8841/10070 [4:12:16<35:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8841/10070 [4:12:16<35:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8842/10070 [4:12:17<35:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8842/10070 [4:12:17<35:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8843/10070 [4:12:19<35:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8843/10070 [4:12:19<35:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8844/10070 [4:12:20<34:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8844/10070 [4:12:20<34:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8845/10070 [4:12:23<34:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8845/10070 [4:12:23<34:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8846/10070 [4:12:24<34:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8846/10070 [4:12:24<34:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8847/10070 [4:12:25<34:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8847/10070 [4:12:25<34:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8848/10070 [4:12:25<34:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8848/10070 [4:12:25<34:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8849/10070 [4:12:27<34:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8849/10070 [4:12:27<34:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8850/10070 [4:12:30<34:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8850/10070 [4:12:30<34:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8851/10070 [4:12:31<34:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8851/10070 [4:12:31<34:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8852/10070 [4:12:34<34:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8852/10070 [4:12:34<34:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8853/10070 [4:12:35<34:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8853/10070 [4:12:35<34:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8854/10070 [4:12:36<34:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8854/10070 [4:12:36<34:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8855/10070 [4:12:38<34:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8855/10070 [4:12:38<34:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8856/10070 [4:12:39<34:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8856/10070 [4:12:39<34:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8857/10070 [4:12:42<34:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8857/10070 [4:12:42<34:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8858/10070 [4:12:42<34:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8858/10070 [4:12:42<34:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8859/10070 [4:12:44<34:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8859/10070 [4:12:44<34:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8860/10070 [4:12:45<34:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8860/10070 [4:12:45<34:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8861/10070 [4:12:46<34:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8861/10070 [4:12:46<34:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8862/10070 [4:12:47<34:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8862/10070 [4:12:47<34:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8863/10070 [4:12:48<34:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8863/10070 [4:12:48<34:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8864/10070 [4:12:57<34:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8864/10070 [4:12:57<34:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8865/10070 [4:12:58<34:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8865/10070 [4:12:58<34:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8866/10070 [4:12:59<34:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8866/10070 [4:12:59<34:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8867/10070 [4:13:00<34:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8867/10070 [4:13:00<34:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8868/10070 [4:13:02<34:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8868/10070 [4:13:02<34:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8869/10070 [4:13:03<34:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8869/10070 [4:13:03<34:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8870/10070 [4:13:03<34:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8870/10070 [4:13:03<34:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8871/10070 [4:13:05<34:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8871/10070 [4:13:05<34:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8872/10070 [4:13:06<34:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8872/10070 [4:13:06<34:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8873/10070 [4:13:07<34:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8873/10070 [4:13:07<34:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8874/10070 [4:13:07<34:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8874/10070 [4:13:07<34:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8875/10070 [4:13:08<34:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8875/10070 [4:13:08<34:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8876/10070 [4:13:09<34:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8876/10070 [4:13:09<34:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8877/10070 [4:13:10<34:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8877/10070 [4:13:10<34:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8878/10070 [4:13:12<33:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8878/10070 [4:13:12<33:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8879/10070 [4:13:14<33:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8879/10070 [4:13:14<33:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8880/10070 [4:13:16<33:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8880/10070 [4:13:16<33:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8881/10070 [4:13:18<33:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8881/10070 [4:13:18<33:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8882/10070 [4:13:19<33:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8882/10070 [4:13:19<33:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8883/10070 [4:13:22<33:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8883/10070 [4:13:22<33:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8884/10070 [4:13:22<33:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8884/10070 [4:13:22<33:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8885/10070 [4:13:24<33:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8885/10070 [4:13:24<33:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8886/10070 [4:13:25<33:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8886/10070 [4:13:25<33:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8887/10070 [4:13:27<33:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8887/10070 [4:13:27<33:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8888/10070 [4:13:28<33:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8888/10070 [4:13:28<33:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8889/10070 [4:13:30<33:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8889/10070 [4:13:30<33:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8890/10070 [4:13:32<33:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8890/10070 [4:13:32<33:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8891/10070 [4:13:34<33:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8891/10070 [4:13:34<33:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8892/10070 [4:13:36<33:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8892/10070 [4:13:36<33:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8893/10070 [4:13:37<33:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8893/10070 [4:13:37<33:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8894/10070 [4:13:39<33:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8894/10070 [4:13:39<33:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8895/10070 [4:13:41<33:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8895/10070 [4:13:41<33:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8896/10070 [4:13:49<33:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8896/10070 [4:13:49<33:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8897/10070 [4:13:50<33:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8897/10070 [4:13:50<33:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8898/10070 [4:13:52<33:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8898/10070 [4:13:52<33:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8899/10070 [4:13:54<33:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8899/10070 [4:13:54<33:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8900/10070 [4:13:55<33:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8900/10070 [4:13:55<33:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8901/10070 [4:13:55<33:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8901/10070 [4:13:55<33:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8902/10070 [4:13:58<33:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8902/10070 [4:13:58<33:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8903/10070 [4:13:59<33:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8903/10070 [4:13:59<33:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8904/10070 [4:14:01<33:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8904/10070 [4:14:01<33:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8905/10070 [4:14:01<33:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8905/10070 [4:14:01<33:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8906/10070 [4:14:03<33:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8906/10070 [4:14:03<33:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8907/10070 [4:14:05<33:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8907/10070 [4:14:05<33:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8908/10070 [4:14:07<33:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8908/10070 [4:14:07<33:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8909/10070 [4:14:08<33:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8909/10070 [4:14:08<33:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8910/10070 [4:14:09<33:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8910/10070 [4:14:09<33:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  88%|▉| 8911/10070 [4:14:10<33:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  88%|▉| 8911/10070 [4:14:10<33:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8912/10070 [4:14:12<33:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8912/10070 [4:14:12<33:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8913/10070 [4:14:13<33:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8913/10070 [4:14:13<33:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8914/10070 [4:14:14<32:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8914/10070 [4:14:14<32:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8915/10070 [4:14:16<32:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8915/10070 [4:14:16<32:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8916/10070 [4:14:18<32:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8916/10070 [4:14:18<32:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8917/10070 [4:14:19<32:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8917/10070 [4:14:19<32:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8918/10070 [4:14:20<32:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8918/10070 [4:14:20<32:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8919/10070 [4:14:21<32:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8919/10070 [4:14:21<32:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8920/10070 [4:14:23<32:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8920/10070 [4:14:23<32:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8921/10070 [4:14:25<32:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8921/10070 [4:14:25<32:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8922/10070 [4:14:26<32:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8922/10070 [4:14:26<32:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8923/10070 [4:14:28<32:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8923/10070 [4:14:28<32:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8924/10070 [4:14:30<32:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8924/10070 [4:14:30<32:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8925/10070 [4:14:30<32:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8925/10070 [4:14:30<32:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8926/10070 [4:14:32<32:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8926/10070 [4:14:32<32:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8927/10070 [4:14:34<32:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8927/10070 [4:14:34<32:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8928/10070 [4:14:43<32:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8928/10070 [4:14:43<32:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8929/10070 [4:14:44<32:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8929/10070 [4:14:44<32:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|��| 8930/10070 [4:14:46<32:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8930/10070 [4:14:46<32:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8931/10070 [4:14:47<32:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8931/10070 [4:14:47<32:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8932/10070 [4:14:47<32:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8932/10070 [4:14:47<32:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8933/10070 [4:14:50<32:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8933/10070 [4:14:50<32:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8934/10070 [4:14:51<32:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8934/10070 [4:14:51<32:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8935/10070 [4:14:52<32:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8935/10070 [4:14:52<32:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8936/10070 [4:14:53<32:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8936/10070 [4:14:53<32:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8937/10070 [4:14:54<32:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8937/10070 [4:14:54<32:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8938/10070 [4:14:55<32:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8938/10070 [4:14:55<32:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8939/10070 [4:14:55<32:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8939/10070 [4:14:55<32:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8940/10070 [4:14:57<32:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8940/10070 [4:14:57<32:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8941/10070 [4:14:58<32:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8941/10070 [4:14:58<32:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8942/10070 [4:15:00<32:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8942/10070 [4:15:00<32:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8943/10070 [4:15:02<32:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8943/10070 [4:15:02<32:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8944/10070 [4:15:04<32:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8944/10070 [4:15:04<32:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8945/10070 [4:15:06<32:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8945/10070 [4:15:06<32:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8946/10070 [4:15:06<32:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8946/10070 [4:15:06<32:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8947/10070 [4:15:07<32:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8947/10070 [4:15:07<32:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8948/10070 [4:15:08<31:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8948/10070 [4:15:08<31:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8949/10070 [4:15:08<31:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8949/10070 [4:15:08<31:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8950/10070 [4:15:11<31:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8950/10070 [4:15:11<31:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8951/10070 [4:15:11<31:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8951/10070 [4:15:11<31:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8952/10070 [4:15:14<31:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8952/10070 [4:15:14<31:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8953/10070 [4:15:15<31:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8953/10070 [4:15:15<31:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8954/10070 [4:15:17<31:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8954/10070 [4:15:17<31:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8955/10070 [4:15:19<31:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8955/10070 [4:15:19<31:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8956/10070 [4:15:21<31:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8956/10070 [4:15:21<31:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8957/10070 [4:15:23<31:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8957/10070 [4:15:23<31:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8958/10070 [4:15:24<31:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8958/10070 [4:15:24<31:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8959/10070 [4:15:25<31:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8959/10070 [4:15:25<31:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8960/10070 [4:15:35<31:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8960/10070 [4:15:35<31:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8961/10070 [4:15:36<31:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8961/10070 [4:15:36<31:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8962/10070 [4:15:38<31:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8962/10070 [4:15:38<31:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8963/10070 [4:15:39<31:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8963/10070 [4:15:39<31:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8964/10070 [4:15:40<31:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8964/10070 [4:15:40<31:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8965/10070 [4:15:43<31:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8965/10070 [4:15:43<31:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8966/10070 [4:15:44<31:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8966/10070 [4:15:44<31:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8967/10070 [4:15:45<31:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8967/10070 [4:15:45<31:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8968/10070 [4:15:46<31:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8968/10070 [4:15:46<31:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8969/10070 [4:15:48<31:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8969/10070 [4:15:48<31:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8970/10070 [4:15:48<31:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8970/10070 [4:15:48<31:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8971/10070 [4:15:51<31:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8971/10070 [4:15:51<31:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8972/10070 [4:15:52<31:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8972/10070 [4:15:52<31:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8973/10070 [4:15:53<31:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8973/10070 [4:15:53<31:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8974/10070 [4:15:53<31:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8974/10070 [4:15:53<31:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8975/10070 [4:15:55<31:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8975/10070 [4:15:55<31:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8976/10070 [4:15:56<31:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8976/10070 [4:15:56<31:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8977/10070 [4:15:56<31:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8977/10070 [4:15:56<31:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8978/10070 [4:15:58<31:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8978/10070 [4:15:58<31:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8979/10070 [4:15:59<31:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8979/10070 [4:15:59<31:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8980/10070 [4:16:00<31:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8980/10070 [4:16:00<31:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8981/10070 [4:16:01<31:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8981/10070 [4:16:01<31:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8982/10070 [4:16:02<31:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8982/10070 [4:16:02<31:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8983/10070 [4:16:03<30:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8983/10070 [4:16:03<30:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8984/10070 [4:16:05<30:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8984/10070 [4:16:05<30:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8985/10070 [4:16:06<30:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8985/10070 [4:16:06<30:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8986/10070 [4:16:08<30:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8986/10070 [4:16:08<30:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8987/10070 [4:16:10<30:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8987/10070 [4:16:10<30:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8988/10070 [4:16:12<30:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8988/10070 [4:16:12<30:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8989/10070 [4:16:15<30:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8989/10070 [4:16:15<30:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8990/10070 [4:16:16<30:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8990/10070 [4:16:16<30:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8991/10070 [4:16:17<30:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8991/10070 [4:16:17<30:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8992/10070 [4:16:28<30:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8992/10070 [4:16:28<30:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8993/10070 [4:16:29<30:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8993/10070 [4:16:29<30:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8994/10070 [4:16:31<30:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8994/10070 [4:16:31<30:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8995/10070 [4:16:33<30:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8995/10070 [4:16:33<30:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8996/10070 [4:16:35<30:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8996/10070 [4:16:35<30:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8997/10070 [4:16:36<30:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8997/10070 [4:16:36<30:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8998/10070 [4:16:37<30:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8998/10070 [4:16:37<30:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 8999/10070 [4:16:38<30:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 8999/10070 [4:16:38<30:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 9000/10070 [4:16:40<30:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 9000/10070 [4:16:40<30:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 9001/10070 [4:16:41<30:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 9001/10070 [4:16:41<30:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 9002/10070 [4:16:42<30:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 9002/10070 [4:16:42<30:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 9003/10070 [4:16:44<30:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 9003/10070 [4:16:44<30:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 9004/10070 [4:16:45<30:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 9004/10070 [4:16:45<30:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 9005/10070 [4:16:47<30:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 9005/10070 [4:16:47<30:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 9006/10070 [4:16:48<30:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 9006/10070 [4:16:48<30:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 9007/10070 [4:16:49<30:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 9007/10070 [4:16:49<30:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 9008/10070 [4:16:50<30:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 9008/10070 [4:16:50<30:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 9009/10070 [4:16:52<30:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 9009/10070 [4:16:52<30:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 9010/10070 [4:16:52<30:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 9010/10070 [4:16:52<30:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 9011/10070 [4:16:55<30:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 9011/10070 [4:16:55<30:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  89%|▉| 9012/10070 [4:16:55<30:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  89%|▉| 9012/10070 [4:16:55<30:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9013/10070 [4:16:58<30:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9013/10070 [4:16:58<30:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9014/10070 [4:17:00<30:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9014/10070 [4:17:00<30:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9015/10070 [4:17:01<30:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9015/10070 [4:17:01<30:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9016/10070 [4:17:04<30:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9016/10070 [4:17:04<30:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9017/10070 [4:17:06<30:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9017/10070 [4:17:06<30:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9018/10070 [4:17:06<29:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9018/10070 [4:17:06<29:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9019/10070 [4:17:07<29:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9019/10070 [4:17:07<29:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9020/10070 [4:17:08<29:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9020/10070 [4:17:08<29:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9021/10070 [4:17:10<29:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9021/10070 [4:17:10<29:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9022/10070 [4:17:10<29:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9022/10070 [4:17:10<29:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9023/10070 [4:17:11<29:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9023/10070 [4:17:11<29:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9024/10070 [4:17:21<29:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9024/10070 [4:17:21<29:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9025/10070 [4:17:23<29:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9025/10070 [4:17:23<29:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9026/10070 [4:17:24<29:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9026/10070 [4:17:24<29:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9027/10070 [4:17:25<29:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9027/10070 [4:17:25<29:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9028/10070 [4:17:27<29:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9028/10070 [4:17:27<29:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9029/10070 [4:17:28<29:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9029/10070 [4:17:28<29:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9030/10070 [4:17:30<29:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9030/10070 [4:17:30<29:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9031/10070 [4:17:31<29:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9031/10070 [4:17:31<29:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9032/10070 [4:17:33<29:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9032/10070 [4:17:33<29:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9033/10070 [4:17:34<29:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9033/10070 [4:17:34<29:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9034/10070 [4:17:35<29:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9034/10070 [4:17:35<29:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9035/10070 [4:17:37<29:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9035/10070 [4:17:37<29:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9036/10070 [4:17:38<29:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9036/10070 [4:17:38<29:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9037/10070 [4:17:39<29:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9037/10070 [4:17:39<29:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9038/10070 [4:17:39<29:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9038/10070 [4:17:39<29:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9039/10070 [4:17:41<29:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9039/10070 [4:17:41<29:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9040/10070 [4:17:43<29:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9040/10070 [4:17:43<29:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9041/10070 [4:17:44<29:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9041/10070 [4:17:44<29:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9042/10070 [4:17:45<29:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9042/10070 [4:17:45<29:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9043/10070 [4:17:47<29:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9043/10070 [4:17:47<29:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9044/10070 [4:17:47<29:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9044/10070 [4:17:47<29:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9045/10070 [4:17:48<29:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9045/10070 [4:17:48<29:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9046/10070 [4:17:49<29:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9046/10070 [4:17:49<29:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9047/10070 [4:17:50<29:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9047/10070 [4:17:50<29:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9048/10070 [4:17:51<29:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9048/10070 [4:17:51<29:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9049/10070 [4:17:53<29:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9049/10070 [4:17:53<29:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9050/10070 [4:17:55<29:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9050/10070 [4:17:55<29:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9051/10070 [4:17:56<29:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9051/10070 [4:17:56<29:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9052/10070 [4:17:57<29:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9052/10070 [4:17:57<29:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9053/10070 [4:17:58<28:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9053/10070 [4:17:58<28:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9054/10070 [4:18:00<28:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9054/10070 [4:18:00<28:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9055/10070 [4:18:01<28:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9055/10070 [4:18:01<28:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9056/10070 [4:18:16<28:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9056/10070 [4:18:16<28:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9057/10070 [4:18:18<28:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9057/10070 [4:18:18<28:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9058/10070 [4:18:19<28:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9058/10070 [4:18:19<28:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9059/10070 [4:18:20<28:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9059/10070 [4:18:20<28:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9060/10070 [4:18:20<28:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9060/10070 [4:18:20<28:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9061/10070 [4:18:21<28:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9061/10070 [4:18:21<28:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9062/10070 [4:18:23<28:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9062/10070 [4:18:23<28:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9063/10070 [4:18:24<28:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9063/10070 [4:18:24<28:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9064/10070 [4:18:25<28:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9064/10070 [4:18:25<28:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9065/10070 [4:18:26<28:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9065/10070 [4:18:26<28:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9066/10070 [4:18:27<28:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9066/10070 [4:18:27<28:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9067/10070 [4:18:29<28:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9067/10070 [4:18:29<28:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9068/10070 [4:18:31<28:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9068/10070 [4:18:31<28:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9069/10070 [4:18:33<28:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9069/10070 [4:18:33<28:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9070/10070 [4:18:35<28:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9070/10070 [4:18:35<28:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9071/10070 [4:18:35<28:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9071/10070 [4:18:35<28:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9072/10070 [4:18:37<28:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9072/10070 [4:18:37<28:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9073/10070 [4:18:37<28:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9073/10070 [4:18:37<28:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9074/10070 [4:18:38<28:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9074/10070 [4:18:38<28:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9075/10070 [4:18:39<28:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9075/10070 [4:18:39<28:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9076/10070 [4:18:39<28:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9076/10070 [4:18:39<28:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9077/10070 [4:18:41<28:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9077/10070 [4:18:41<28:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9078/10070 [4:18:43<28:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9078/10070 [4:18:43<28:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9079/10070 [4:18:44<28:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9079/10070 [4:18:44<28:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9080/10070 [4:18:46<28:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9080/10070 [4:18:46<28:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9081/10070 [4:18:47<28:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9081/10070 [4:18:47<28:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9082/10070 [4:18:49<28:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9082/10070 [4:18:49<28:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9083/10070 [4:18:51<28:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9083/10070 [4:18:51<28:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9084/10070 [4:18:52<28:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9084/10070 [4:18:52<28:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9085/10070 [4:18:53<28:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9085/10070 [4:18:53<28:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9086/10070 [4:18:54<28:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9086/10070 [4:18:54<28:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9087/10070 [4:18:55<28:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9087/10070 [4:18:55<28:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9088/10070 [4:19:09<28:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9088/10070 [4:19:09<28:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9089/10070 [4:19:10<27:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9089/10070 [4:19:10<27:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9090/10070 [4:19:12<27:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9090/10070 [4:19:12<27:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9091/10070 [4:19:14<27:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9091/10070 [4:19:14<27:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9092/10070 [4:19:16<27:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9092/10070 [4:19:16<27:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9093/10070 [4:19:17<27:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9093/10070 [4:19:17<27:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9094/10070 [4:19:18<27:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9094/10070 [4:19:18<27:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9095/10070 [4:19:19<27:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9095/10070 [4:19:19<27:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9096/10070 [4:19:21<27:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9096/10070 [4:19:21<27:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9097/10070 [4:19:22<27:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9097/10070 [4:19:22<27:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9098/10070 [4:19:22<27:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9098/10070 [4:19:22<27:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9099/10070 [4:19:24<27:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9099/10070 [4:19:24<27:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9100/10070 [4:19:25<27:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9100/10070 [4:19:25<27:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9101/10070 [4:19:28<27:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9101/10070 [4:19:28<27:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9102/10070 [4:19:29<27:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9102/10070 [4:19:29<27:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9103/10070 [4:19:30<27:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9103/10070 [4:19:30<27:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9104/10070 [4:19:31<27:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9104/10070 [4:19:31<27:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9105/10070 [4:19:32<27:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9105/10070 [4:19:32<27:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9106/10070 [4:19:34<27:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9106/10070 [4:19:34<27:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9107/10070 [4:19:36<27:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9107/10070 [4:19:36<27:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9108/10070 [4:19:38<27:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9108/10070 [4:19:38<27:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9109/10070 [4:19:39<27:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9109/10070 [4:19:39<27:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9110/10070 [4:19:41<27:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9110/10070 [4:19:41<27:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9111/10070 [4:19:43<27:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9111/10070 [4:19:43<27:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9112/10070 [4:19:44<27:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9112/10070 [4:19:44<27:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  90%|▉| 9113/10070 [4:19:45<27:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  90%|▉| 9113/10070 [4:19:45<27:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9114/10070 [4:19:46<27:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9114/10070 [4:19:46<27:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9115/10070 [4:19:48<27:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9115/10070 [4:19:48<27:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9116/10070 [4:19:50<27:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9116/10070 [4:19:50<27:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9117/10070 [4:19:51<27:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9117/10070 [4:19:51<27:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9118/10070 [4:19:53<27:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9118/10070 [4:19:53<27:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9119/10070 [4:19:54<27:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9119/10070 [4:19:54<27:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9120/10070 [4:20:04<27:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9120/10070 [4:20:04<27:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9121/10070 [4:20:05<27:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9121/10070 [4:20:05<27:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9122/10070 [4:20:07<27:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9122/10070 [4:20:07<27:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9123/10070 [4:20:09<27:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9123/10070 [4:20:09<27:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9124/10070 [4:20:10<26:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9124/10070 [4:20:10<26:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9125/10070 [4:20:12<26:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9125/10070 [4:20:12<26:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9126/10070 [4:20:13<26:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9126/10070 [4:20:13<26:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9127/10070 [4:20:14<26:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9127/10070 [4:20:14<26:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9128/10070 [4:20:16<26:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9128/10070 [4:20:16<26:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9129/10070 [4:20:17<26:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9129/10070 [4:20:17<26:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9130/10070 [4:20:18<26:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9130/10070 [4:20:18<26:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9131/10070 [4:20:19<26:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9131/10070 [4:20:19<26:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9132/10070 [4:20:19<26:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9132/10070 [4:20:19<26:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9133/10070 [4:20:22<26:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9133/10070 [4:20:22<26:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9134/10070 [4:20:24<26:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9134/10070 [4:20:24<26:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9135/10070 [4:20:26<26:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9135/10070 [4:20:26<26:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9136/10070 [4:20:28<26:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9136/10070 [4:20:28<26:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9137/10070 [4:20:30<26:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9137/10070 [4:20:30<26:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9138/10070 [4:20:31<26:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9138/10070 [4:20:31<26:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9139/10070 [4:20:32<26:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9139/10070 [4:20:32<26:32,  1.71s/it, v_num=tif6, train/loss=8."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9140/10070 [4:20:33<26:30,  1.71s/it, v_num=tif6, train/loss=8.\r",
-      "Epoch 0:  91%|▉| 9140/10070 [4:20:33<26:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9141/10070 [4:20:34<26:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9141/10070 [4:20:34<26:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9142/10070 [4:20:37<26:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9142/10070 [4:20:37<26:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9143/10070 [4:20:38<26:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9143/10070 [4:20:38<26:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9144/10070 [4:20:41<26:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9144/10070 [4:20:41<26:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9145/10070 [4:20:41<26:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9145/10070 [4:20:41<26:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9146/10070 [4:20:42<26:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9146/10070 [4:20:42<26:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9147/10070 [4:20:44<26:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9147/10070 [4:20:44<26:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9148/10070 [4:20:45<26:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9148/10070 [4:20:45<26:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9149/10070 [4:20:47<26:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9149/10070 [4:20:47<26:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9150/10070 [4:20:48<26:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9150/10070 [4:20:48<26:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9151/10070 [4:20:49<26:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9151/10070 [4:20:49<26:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9152/10070 [4:20:56<26:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9152/10070 [4:20:56<26:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9153/10070 [4:20:58<26:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9153/10070 [4:20:58<26:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9154/10070 [4:20:59<26:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9154/10070 [4:20:59<26:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9155/10070 [4:20:59<26:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9155/10070 [4:20:59<26:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9156/10070 [4:21:01<26:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9156/10070 [4:21:01<26:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9157/10070 [4:21:02<26:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9157/10070 [4:21:02<26:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9158/10070 [4:21:03<25:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9158/10070 [4:21:03<25:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9159/10070 [4:21:04<25:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9159/10070 [4:21:04<25:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9160/10070 [4:21:05<25:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9160/10070 [4:21:05<25:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9161/10070 [4:21:08<25:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9161/10070 [4:21:08<25:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9162/10070 [4:21:09<25:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9162/10070 [4:21:09<25:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9163/10070 [4:21:11<25:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9163/10070 [4:21:11<25:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9164/10070 [4:21:11<25:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9164/10070 [4:21:11<25:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9165/10070 [4:21:13<25:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9165/10070 [4:21:13<25:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9166/10070 [4:21:14<25:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9166/10070 [4:21:14<25:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9167/10070 [4:21:15<25:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9167/10070 [4:21:15<25:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9168/10070 [4:21:15<25:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9168/10070 [4:21:15<25:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9169/10070 [4:21:16<25:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9169/10070 [4:21:16<25:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9170/10070 [4:21:17<25:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9170/10070 [4:21:17<25:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9171/10070 [4:21:18<25:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9171/10070 [4:21:18<25:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9172/10070 [4:21:20<25:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9172/10070 [4:21:20<25:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9173/10070 [4:21:20<25:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9173/10070 [4:21:20<25:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9174/10070 [4:21:22<25:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9174/10070 [4:21:22<25:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9175/10070 [4:21:23<25:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9175/10070 [4:21:23<25:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9176/10070 [4:21:24<25:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9176/10070 [4:21:24<25:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9177/10070 [4:21:25<25:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9177/10070 [4:21:25<25:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9178/10070 [4:21:27<25:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9178/10070 [4:21:27<25:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9179/10070 [4:21:29<25:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9179/10070 [4:21:29<25:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9180/10070 [4:21:30<25:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9180/10070 [4:21:30<25:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9181/10070 [4:21:32<25:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9181/10070 [4:21:32<25:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9182/10070 [4:21:33<25:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9182/10070 [4:21:33<25:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9183/10070 [4:21:35<25:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9183/10070 [4:21:35<25:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9184/10070 [4:21:52<25:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9184/10070 [4:21:52<25:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9185/10070 [4:21:54<25:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9185/10070 [4:21:55<25:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9186/10070 [4:21:56<25:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9186/10070 [4:21:56<25:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9187/10070 [4:21:57<25:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9187/10070 [4:21:57<25:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9188/10070 [4:21:58<25:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9188/10070 [4:21:58<25:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9189/10070 [4:22:00<25:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9189/10070 [4:22:00<25:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9190/10070 [4:22:01<25:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9190/10070 [4:22:01<25:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9191/10070 [4:22:03<25:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9191/10070 [4:22:03<25:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9192/10070 [4:22:05<25:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9192/10070 [4:22:05<25:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9193/10070 [4:22:06<25:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9193/10070 [4:22:06<25:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9194/10070 [4:22:08<24:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9194/10070 [4:22:08<24:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9195/10070 [4:22:09<24:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9195/10070 [4:22:09<24:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9196/10070 [4:22:10<24:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9196/10070 [4:22:10<24:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9197/10070 [4:22:12<24:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9197/10070 [4:22:12<24:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9198/10070 [4:22:14<24:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9198/10070 [4:22:14<24:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9199/10070 [4:22:14<24:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9199/10070 [4:22:14<24:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9200/10070 [4:22:15<24:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9200/10070 [4:22:15<24:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9201/10070 [4:22:17<24:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9201/10070 [4:22:17<24:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9202/10070 [4:22:17<24:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9202/10070 [4:22:17<24:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9203/10070 [4:22:19<24:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9203/10070 [4:22:19<24:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9204/10070 [4:22:21<24:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9204/10070 [4:22:21<24:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9205/10070 [4:22:22<24:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9205/10070 [4:22:22<24:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9206/10070 [4:22:23<24:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9206/10070 [4:22:23<24:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9207/10070 [4:22:25<24:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9207/10070 [4:22:25<24:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9208/10070 [4:22:27<24:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9208/10070 [4:22:27<24:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9209/10070 [4:22:28<24:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9209/10070 [4:22:28<24:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9210/10070 [4:22:29<24:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9210/10070 [4:22:29<24:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9211/10070 [4:22:31<24:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9211/10070 [4:22:31<24:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9212/10070 [4:22:32<24:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9212/10070 [4:22:32<24:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9213/10070 [4:22:33<24:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9213/10070 [4:22:33<24:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  91%|▉| 9214/10070 [4:22:34<24:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  91%|▉| 9214/10070 [4:22:34<24:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9215/10070 [4:22:35<24:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9215/10070 [4:22:35<24:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9216/10070 [4:22:43<24:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9216/10070 [4:22:43<24:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9217/10070 [4:22:45<24:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9217/10070 [4:22:45<24:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9218/10070 [4:22:45<24:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9218/10070 [4:22:45<24:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9219/10070 [4:22:47<24:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9219/10070 [4:22:47<24:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9220/10070 [4:22:49<24:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9220/10070 [4:22:49<24:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9221/10070 [4:22:50<24:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9221/10070 [4:22:50<24:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9222/10070 [4:22:52<24:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9222/10070 [4:22:52<24:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9223/10070 [4:22:53<24:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9223/10070 [4:22:53<24:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9224/10070 [4:22:54<24:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9224/10070 [4:22:54<24:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9225/10070 [4:22:56<24:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9225/10070 [4:22:56<24:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9226/10070 [4:22:57<24:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9226/10070 [4:22:57<24:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9227/10070 [4:22:59<24:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9227/10070 [4:22:59<24:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9228/10070 [4:23:00<23:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9228/10070 [4:23:00<23:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9229/10070 [4:23:02<23:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9229/10070 [4:23:02<23:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9230/10070 [4:23:03<23:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9230/10070 [4:23:03<23:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9231/10070 [4:23:04<23:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9231/10070 [4:23:04<23:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9232/10070 [4:23:05<23:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9232/10070 [4:23:05<23:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9233/10070 [4:23:06<23:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9233/10070 [4:23:06<23:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9234/10070 [4:23:07<23:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9234/10070 [4:23:07<23:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9235/10070 [4:23:09<23:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9235/10070 [4:23:09<23:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9236/10070 [4:23:10<23:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9236/10070 [4:23:10<23:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9237/10070 [4:23:12<23:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9237/10070 [4:23:12<23:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9238/10070 [4:23:14<23:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9238/10070 [4:23:14<23:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9239/10070 [4:23:15<23:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9239/10070 [4:23:15<23:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9240/10070 [4:23:17<23:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9240/10070 [4:23:17<23:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9241/10070 [4:23:19<23:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9241/10070 [4:23:19<23:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9242/10070 [4:23:22<23:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9242/10070 [4:23:22<23:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9243/10070 [4:23:22<23:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9243/10070 [4:23:22<23:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9244/10070 [4:23:24<23:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9244/10070 [4:23:24<23:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9245/10070 [4:23:25<23:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9245/10070 [4:23:25<23:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9246/10070 [4:23:25<23:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9246/10070 [4:23:25<23:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9247/10070 [4:23:27<23:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9247/10070 [4:23:27<23:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9248/10070 [4:23:38<23:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9248/10070 [4:23:38<23:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9249/10070 [4:23:40<23:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9249/10070 [4:23:40<23:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9250/10070 [4:23:40<23:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9250/10070 [4:23:40<23:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9251/10070 [4:23:41<23:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9251/10070 [4:23:41<23:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9252/10070 [4:23:42<23:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9252/10070 [4:23:42<23:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9253/10070 [4:23:43<23:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9253/10070 [4:23:43<23:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9254/10070 [4:23:44<23:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9254/10070 [4:23:44<23:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9255/10070 [4:23:46<23:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9255/10070 [4:23:46<23:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9256/10070 [4:23:47<23:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9256/10070 [4:23:47<23:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9257/10070 [4:23:48<23:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9257/10070 [4:23:48<23:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9258/10070 [4:23:49<23:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9258/10070 [4:23:49<23:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9259/10070 [4:23:50<23:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9259/10070 [4:23:50<23:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9260/10070 [4:23:52<23:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9260/10070 [4:23:52<23:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9261/10070 [4:23:53<23:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9261/10070 [4:23:53<23:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9262/10070 [4:23:54<23:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9262/10070 [4:23:54<23:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9263/10070 [4:23:56<22:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9263/10070 [4:23:56<22:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9264/10070 [4:23:57<22:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9264/10070 [4:23:57<22:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9265/10070 [4:23:59<22:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9265/10070 [4:23:59<22:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9266/10070 [4:23:59<22:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9266/10070 [4:23:59<22:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9267/10070 [4:24:02<22:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9267/10070 [4:24:02<22:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9268/10070 [4:24:02<22:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9268/10070 [4:24:02<22:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9269/10070 [4:24:03<22:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9269/10070 [4:24:03<22:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9270/10070 [4:24:04<22:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9270/10070 [4:24:04<22:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9271/10070 [4:24:04<22:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9271/10070 [4:24:04<22:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9272/10070 [4:24:06<22:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9272/10070 [4:24:06<22:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9273/10070 [4:24:07<22:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9273/10070 [4:24:07<22:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9274/10070 [4:24:08<22:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9274/10070 [4:24:08<22:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9275/10070 [4:24:10<22:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9275/10070 [4:24:10<22:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9276/10070 [4:24:12<22:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9276/10070 [4:24:12<22:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9277/10070 [4:24:13<22:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9277/10070 [4:24:13<22:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9278/10070 [4:24:15<22:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9278/10070 [4:24:15<22:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9279/10070 [4:24:17<22:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9279/10070 [4:24:17<22:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9280/10070 [4:24:31<22:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9280/10070 [4:24:31<22:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9281/10070 [4:24:32<22:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9281/10070 [4:24:32<22:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9282/10070 [4:24:33<22:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9282/10070 [4:24:33<22:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9283/10070 [4:24:35<22:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9283/10070 [4:24:35<22:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9284/10070 [4:24:37<22:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9284/10070 [4:24:37<22:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9285/10070 [4:24:38<22:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9285/10070 [4:24:38<22:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9286/10070 [4:24:39<22:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9286/10070 [4:24:39<22:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9287/10070 [4:24:40<22:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9287/10070 [4:24:40<22:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9288/10070 [4:24:41<22:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9288/10070 [4:24:41<22:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9289/10070 [4:24:42<22:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9289/10070 [4:24:42<22:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9290/10070 [4:24:42<22:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9290/10070 [4:24:42<22:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9291/10070 [4:24:43<22:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9291/10070 [4:24:43<22:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9292/10070 [4:24:45<22:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9292/10070 [4:24:45<22:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9293/10070 [4:24:46<22:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9293/10070 [4:24:46<22:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9294/10070 [4:24:48<22:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9294/10070 [4:24:48<22:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9295/10070 [4:24:50<22:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9295/10070 [4:24:50<22:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9296/10070 [4:24:51<22:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9296/10070 [4:24:51<22:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9297/10070 [4:24:52<22:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9297/10070 [4:24:52<22:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9298/10070 [4:24:54<21:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9298/10070 [4:24:54<21:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9299/10070 [4:24:56<21:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9299/10070 [4:24:56<21:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9300/10070 [4:24:57<21:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9300/10070 [4:24:57<21:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9301/10070 [4:24:59<21:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9301/10070 [4:24:59<21:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9302/10070 [4:25:01<21:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9302/10070 [4:25:01<21:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9303/10070 [4:25:02<21:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9303/10070 [4:25:02<21:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9304/10070 [4:25:02<21:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9304/10070 [4:25:02<21:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9305/10070 [4:25:04<21:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9305/10070 [4:25:04<21:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9306/10070 [4:25:05<21:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9306/10070 [4:25:05<21:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9307/10070 [4:25:07<21:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9307/10070 [4:25:07<21:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9308/10070 [4:25:08<21:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9308/10070 [4:25:08<21:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9309/10070 [4:25:11<21:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9309/10070 [4:25:11<21:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9310/10070 [4:25:11<21:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9310/10070 [4:25:11<21:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9311/10070 [4:25:13<21:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9311/10070 [4:25:13<21:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9312/10070 [4:25:28<21:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9312/10070 [4:25:28<21:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9313/10070 [4:25:29<21:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9313/10070 [4:25:29<21:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  92%|▉| 9314/10070 [4:25:31<21:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  92%|▉| 9314/10070 [4:25:31<21:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9315/10070 [4:25:32<21:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9315/10070 [4:25:32<21:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9316/10070 [4:25:33<21:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9316/10070 [4:25:33<21:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9317/10070 [4:25:33<21:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9317/10070 [4:25:33<21:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9318/10070 [4:25:34<21:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9318/10070 [4:25:34<21:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9319/10070 [4:25:36<21:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9319/10070 [4:25:36<21:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9320/10070 [4:25:37<21:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9320/10070 [4:25:37<21:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9321/10070 [4:25:38<21:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9321/10070 [4:25:38<21:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9322/10070 [4:25:40<21:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9322/10070 [4:25:40<21:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9323/10070 [4:25:42<21:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9323/10070 [4:25:42<21:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9324/10070 [4:25:43<21:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9324/10070 [4:25:43<21:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9325/10070 [4:25:44<21:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9325/10070 [4:25:44<21:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9326/10070 [4:25:47<21:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9326/10070 [4:25:47<21:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9327/10070 [4:25:49<21:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9327/10070 [4:25:49<21:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9328/10070 [4:25:49<21:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9328/10070 [4:25:49<21:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9329/10070 [4:25:51<21:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9329/10070 [4:25:51<21:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9330/10070 [4:25:52<21:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9330/10070 [4:25:52<21:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9331/10070 [4:25:53<21:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9331/10070 [4:25:53<21:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9332/10070 [4:25:54<21:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9332/10070 [4:25:54<21:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9333/10070 [4:25:55<20:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9333/10070 [4:25:55<20:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9334/10070 [4:25:56<20:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9334/10070 [4:25:56<20:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9335/10070 [4:25:58<20:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9335/10070 [4:25:58<20:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9336/10070 [4:26:00<20:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9336/10070 [4:26:00<20:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9337/10070 [4:26:00<20:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9337/10070 [4:26:00<20:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9338/10070 [4:26:01<20:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9338/10070 [4:26:01<20:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9339/10070 [4:26:02<20:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9339/10070 [4:26:02<20:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9340/10070 [4:26:04<20:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9340/10070 [4:26:04<20:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9341/10070 [4:26:05<20:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9341/10070 [4:26:05<20:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9342/10070 [4:26:07<20:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9342/10070 [4:26:07<20:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9343/10070 [4:26:09<20:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9343/10070 [4:26:09<20:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9344/10070 [4:26:21<20:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9344/10070 [4:26:21<20:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9345/10070 [4:26:23<20:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9345/10070 [4:26:23<20:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9346/10070 [4:26:25<20:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9346/10070 [4:26:25<20:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9347/10070 [4:26:27<20:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9347/10070 [4:26:27<20:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9348/10070 [4:26:28<20:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9348/10070 [4:26:28<20:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9349/10070 [4:26:30<20:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9349/10070 [4:26:30<20:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9350/10070 [4:26:32<20:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9350/10070 [4:26:32<20:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9351/10070 [4:26:33<20:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9351/10070 [4:26:33<20:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9352/10070 [4:26:33<20:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9352/10070 [4:26:33<20:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9353/10070 [4:26:35<20:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9353/10070 [4:26:35<20:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9354/10070 [4:26:37<20:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9354/10070 [4:26:37<20:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9355/10070 [4:26:39<20:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9355/10070 [4:26:39<20:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9356/10070 [4:26:41<20:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9356/10070 [4:26:41<20:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9357/10070 [4:26:43<20:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9357/10070 [4:26:43<20:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9358/10070 [4:26:45<20:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9358/10070 [4:26:45<20:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9359/10070 [4:26:47<20:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9359/10070 [4:26:47<20:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9360/10070 [4:26:48<20:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9360/10070 [4:26:48<20:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9361/10070 [4:26:49<20:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9361/10070 [4:26:49<20:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9362/10070 [4:26:49<20:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9362/10070 [4:26:49<20:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9363/10070 [4:26:51<20:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9363/10070 [4:26:51<20:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9364/10070 [4:26:52<20:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9364/10070 [4:26:52<20:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9365/10070 [4:26:53<20:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9365/10070 [4:26:53<20:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9366/10070 [4:26:54<20:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9366/10070 [4:26:54<20:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9367/10070 [4:26:57<20:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9367/10070 [4:26:57<20:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9368/10070 [4:26:59<20:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9368/10070 [4:26:59<20:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9369/10070 [4:27:01<19:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9369/10070 [4:27:01<19:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9370/10070 [4:27:01<19:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9370/10070 [4:27:01<19:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9371/10070 [4:27:02<19:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9371/10070 [4:27:02<19:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9372/10070 [4:27:04<19:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9372/10070 [4:27:04<19:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9373/10070 [4:27:06<19:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9373/10070 [4:27:06<19:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9374/10070 [4:27:08<19:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9374/10070 [4:27:08<19:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9375/10070 [4:27:10<19:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9375/10070 [4:27:10<19:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9376/10070 [4:27:16<19:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9376/10070 [4:27:16<19:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9377/10070 [4:27:17<19:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9377/10070 [4:27:17<19:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9378/10070 [4:27:19<19:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9378/10070 [4:27:19<19:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9379/10070 [4:27:20<19:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9379/10070 [4:27:20<19:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9380/10070 [4:27:22<19:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9380/10070 [4:27:22<19:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9381/10070 [4:27:22<19:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9381/10070 [4:27:22<19:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9382/10070 [4:27:24<19:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9382/10070 [4:27:24<19:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9383/10070 [4:27:26<19:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9383/10070 [4:27:26<19:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9384/10070 [4:27:27<19:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9384/10070 [4:27:27<19:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9385/10070 [4:27:29<19:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9385/10070 [4:27:29<19:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9386/10070 [4:27:30<19:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9386/10070 [4:27:30<19:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9387/10070 [4:27:32<19:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9387/10070 [4:27:32<19:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9388/10070 [4:27:33<19:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9388/10070 [4:27:33<19:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9389/10070 [4:27:33<19:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9389/10070 [4:27:33<19:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9390/10070 [4:27:35<19:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9390/10070 [4:27:35<19:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9391/10070 [4:27:36<19:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9391/10070 [4:27:36<19:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9392/10070 [4:27:37<19:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9392/10070 [4:27:37<19:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9393/10070 [4:27:38<19:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9393/10070 [4:27:38<19:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9394/10070 [4:27:40<19:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9394/10070 [4:27:40<19:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9395/10070 [4:27:42<19:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9395/10070 [4:27:42<19:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9396/10070 [4:27:44<19:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9396/10070 [4:27:44<19:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9397/10070 [4:27:45<19:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9397/10070 [4:27:45<19:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9398/10070 [4:27:45<19:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9398/10070 [4:27:45<19:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9399/10070 [4:27:46<19:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9399/10070 [4:27:46<19:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9400/10070 [4:27:48<19:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9400/10070 [4:27:48<19:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9401/10070 [4:27:50<19:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9401/10070 [4:27:50<19:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9402/10070 [4:27:50<19:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9402/10070 [4:27:50<19:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9403/10070 [4:27:52<19:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9403/10070 [4:27:52<19:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9404/10070 [4:27:53<18:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9404/10070 [4:27:53<18:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9405/10070 [4:27:54<18:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9405/10070 [4:27:54<18:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9406/10070 [4:27:56<18:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9406/10070 [4:27:56<18:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9407/10070 [4:27:57<18:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9407/10070 [4:27:57<18:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9408/10070 [4:28:06<18:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9408/10070 [4:28:06<18:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9409/10070 [4:28:08<18:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9409/10070 [4:28:08<18:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9410/10070 [4:28:09<18:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9410/10070 [4:28:09<18:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9411/10070 [4:28:10<18:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9411/10070 [4:28:10<18:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9412/10070 [4:28:12<18:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9412/10070 [4:28:12<18:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9413/10070 [4:28:12<18:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9413/10070 [4:28:12<18:43,  1.71s/it, v_num=tif6, train/loss=8."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9414/10070 [4:28:13<18:41,  1.71s/it, v_num=tif6, train/loss=8.\r",
-      "Epoch 0:  93%|▉| 9414/10070 [4:28:13<18:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  93%|▉| 9415/10070 [4:28:14<18:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  93%|▉| 9415/10070 [4:28:14<18:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9416/10070 [4:28:16<18:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9416/10070 [4:28:16<18:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9417/10070 [4:28:17<18:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9417/10070 [4:28:17<18:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9418/10070 [4:28:18<18:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9418/10070 [4:28:18<18:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9419/10070 [4:28:18<18:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9419/10070 [4:28:18<18:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9420/10070 [4:28:19<18:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9420/10070 [4:28:19<18:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9421/10070 [4:28:21<18:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9421/10070 [4:28:21<18:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9422/10070 [4:28:24<18:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9422/10070 [4:28:24<18:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9423/10070 [4:28:26<18:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9423/10070 [4:28:26<18:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9424/10070 [4:28:26<18:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9424/10070 [4:28:26<18:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9425/10070 [4:28:28<18:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9425/10070 [4:28:28<18:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9426/10070 [4:28:30<18:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9426/10070 [4:28:30<18:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9427/10070 [4:28:31<18:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9427/10070 [4:28:31<18:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9428/10070 [4:28:31<18:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9428/10070 [4:28:31<18:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9429/10070 [4:28:32<18:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9429/10070 [4:28:32<18:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9430/10070 [4:28:34<18:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9430/10070 [4:28:34<18:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9431/10070 [4:28:35<18:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9431/10070 [4:28:35<18:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9432/10070 [4:28:36<18:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9432/10070 [4:28:36<18:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9433/10070 [4:28:38<18:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9433/10070 [4:28:38<18:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9434/10070 [4:28:40<18:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9434/10070 [4:28:40<18:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9435/10070 [4:28:42<18:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9435/10070 [4:28:42<18:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9436/10070 [4:28:44<18:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9436/10070 [4:28:44<18:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9437/10070 [4:28:46<18:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9437/10070 [4:28:46<18:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9438/10070 [4:28:47<17:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9438/10070 [4:28:47<17:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9439/10070 [4:28:48<17:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9439/10070 [4:28:48<17:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9440/10070 [4:28:59<17:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9440/10070 [4:28:59<17:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9441/10070 [4:29:01<17:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9441/10070 [4:29:01<17:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9442/10070 [4:29:02<17:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9442/10070 [4:29:02<17:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9443/10070 [4:29:04<17:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9443/10070 [4:29:04<17:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9444/10070 [4:29:06<17:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9444/10070 [4:29:06<17:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9445/10070 [4:29:07<17:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9445/10070 [4:29:07<17:48,  1.71s/it, v_num=tif6, train/loss=7."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9446/10070 [4:29:09<17:46,  1.71s/it, v_num=tif6, train/loss=7.\r",
-      "Epoch 0:  94%|▉| 9446/10070 [4:29:09<17:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9447/10070 [4:29:11<17:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9447/10070 [4:29:11<17:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9448/10070 [4:29:12<17:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9448/10070 [4:29:12<17:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9449/10070 [4:29:13<17:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9449/10070 [4:29:13<17:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9450/10070 [4:29:15<17:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9450/10070 [4:29:15<17:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9451/10070 [4:29:15<17:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9451/10070 [4:29:15<17:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9452/10070 [4:29:16<17:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9452/10070 [4:29:16<17:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9453/10070 [4:29:18<17:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9453/10070 [4:29:18<17:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9454/10070 [4:29:19<17:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9454/10070 [4:29:19<17:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9455/10070 [4:29:21<17:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9455/10070 [4:29:21<17:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9456/10070 [4:29:21<17:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9456/10070 [4:29:21<17:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9457/10070 [4:29:24<17:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9457/10070 [4:29:24<17:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9458/10070 [4:29:26<17:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9458/10070 [4:29:26<17:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9459/10070 [4:29:28<17:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9459/10070 [4:29:28<17:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9460/10070 [4:29:30<17:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9460/10070 [4:29:30<17:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9461/10070 [4:29:31<17:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9461/10070 [4:29:31<17:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9462/10070 [4:29:33<17:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9462/10070 [4:29:33<17:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9463/10070 [4:29:34<17:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9463/10070 [4:29:34<17:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9464/10070 [4:29:35<17:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9464/10070 [4:29:35<17:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9465/10070 [4:29:37<17:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9465/10070 [4:29:37<17:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9466/10070 [4:29:39<17:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9466/10070 [4:29:39<17:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9467/10070 [4:29:40<17:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9467/10070 [4:29:40<17:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9468/10070 [4:29:41<17:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9468/10070 [4:29:41<17:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9469/10070 [4:29:43<17:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9469/10070 [4:29:43<17:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9470/10070 [4:29:45<17:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9470/10070 [4:29:45<17:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9471/10070 [4:29:46<17:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9471/10070 [4:29:46<17:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9472/10070 [4:29:54<17:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9472/10070 [4:29:54<17:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9473/10070 [4:29:56<17:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9473/10070 [4:29:56<17:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9474/10070 [4:29:58<16:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9474/10070 [4:29:58<16:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9475/10070 [4:30:00<16:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9475/10070 [4:30:00<16:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9476/10070 [4:30:01<16:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9476/10070 [4:30:01<16:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9477/10070 [4:30:02<16:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9477/10070 [4:30:02<16:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9478/10070 [4:30:03<16:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9478/10070 [4:30:03<16:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9479/10070 [4:30:05<16:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9479/10070 [4:30:05<16:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9480/10070 [4:30:05<16:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9480/10070 [4:30:05<16:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9481/10070 [4:30:07<16:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9481/10070 [4:30:07<16:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9482/10070 [4:30:09<16:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9482/10070 [4:30:09<16:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9483/10070 [4:30:11<16:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9483/10070 [4:30:11<16:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9484/10070 [4:30:12<16:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9484/10070 [4:30:12<16:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9485/10070 [4:30:14<16:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9485/10070 [4:30:14<16:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9486/10070 [4:30:14<16:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9486/10070 [4:30:14<16:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9487/10070 [4:30:16<16:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9487/10070 [4:30:16<16:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9488/10070 [4:30:17<16:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9488/10070 [4:30:17<16:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9489/10070 [4:30:19<16:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9489/10070 [4:30:19<16:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9490/10070 [4:30:21<16:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9490/10070 [4:30:21<16:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9491/10070 [4:30:21<16:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9491/10070 [4:30:21<16:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9492/10070 [4:30:23<16:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9492/10070 [4:30:23<16:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9493/10070 [4:30:25<16:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9493/10070 [4:30:25<16:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9494/10070 [4:30:26<16:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9494/10070 [4:30:26<16:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9495/10070 [4:30:28<16:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9495/10070 [4:30:28<16:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9496/10070 [4:30:30<16:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9496/10070 [4:30:30<16:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9497/10070 [4:30:31<16:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9497/10070 [4:30:31<16:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9498/10070 [4:30:32<16:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9498/10070 [4:30:32<16:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9499/10070 [4:30:34<16:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9499/10070 [4:30:34<16:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9500/10070 [4:30:35<16:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9500/10070 [4:30:35<16:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9501/10070 [4:30:35<16:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9501/10070 [4:30:35<16:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9502/10070 [4:30:36<16:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9502/10070 [4:30:36<16:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9503/10070 [4:30:38<16:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9503/10070 [4:30:38<16:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9504/10070 [4:30:45<16:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9504/10070 [4:30:45<16:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9505/10070 [4:30:46<16:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9505/10070 [4:30:46<16:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9506/10070 [4:30:47<16:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9506/10070 [4:30:47<16:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9507/10070 [4:30:47<16:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9507/10070 [4:30:47<16:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9508/10070 [4:30:48<16:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9508/10070 [4:30:48<16:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9509/10070 [4:30:50<15:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9509/10070 [4:30:50<15:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9510/10070 [4:30:51<15:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9510/10070 [4:30:51<15:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9511/10070 [4:30:53<15:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9511/10070 [4:30:53<15:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9512/10070 [4:30:55<15:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9512/10070 [4:30:55<15:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9513/10070 [4:30:56<15:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9513/10070 [4:30:56<15:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9514/10070 [4:30:57<15:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9514/10070 [4:30:57<15:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9515/10070 [4:30:58<15:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9515/10070 [4:30:58<15:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  94%|▉| 9516/10070 [4:30:59<15:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  94%|▉| 9516/10070 [4:30:59<15:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9517/10070 [4:30:59<15:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9517/10070 [4:30:59<15:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9518/10070 [4:31:00<15:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9518/10070 [4:31:00<15:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9519/10070 [4:31:02<15:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9519/10070 [4:31:02<15:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9520/10070 [4:31:03<15:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9520/10070 [4:31:03<15:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9521/10070 [4:31:05<15:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9521/10070 [4:31:05<15:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9522/10070 [4:31:06<15:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9522/10070 [4:31:06<15:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9523/10070 [4:31:07<15:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9523/10070 [4:31:07<15:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9524/10070 [4:31:09<15:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9524/10070 [4:31:09<15:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9525/10070 [4:31:09<15:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9525/10070 [4:31:09<15:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9526/10070 [4:31:11<15:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9526/10070 [4:31:11<15:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9527/10070 [4:31:13<15:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9527/10070 [4:31:13<15:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9528/10070 [4:31:15<15:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9528/10070 [4:31:15<15:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9529/10070 [4:31:15<15:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9529/10070 [4:31:15<15:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9530/10070 [4:31:17<15:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9530/10070 [4:31:17<15:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9531/10070 [4:31:18<15:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9531/10070 [4:31:18<15:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9532/10070 [4:31:19<15:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9532/10070 [4:31:19<15:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9533/10070 [4:31:21<15:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9533/10070 [4:31:21<15:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9534/10070 [4:31:22<15:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9534/10070 [4:31:22<15:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9535/10070 [4:31:24<15:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9535/10070 [4:31:24<15:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9536/10070 [4:31:36<15:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9536/10070 [4:31:36<15:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9537/10070 [4:31:38<15:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9537/10070 [4:31:38<15:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9538/10070 [4:31:39<15:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9538/10070 [4:31:39<15:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9539/10070 [4:31:41<15:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9539/10070 [4:31:41<15:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9540/10070 [4:31:43<15:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9540/10070 [4:31:43<15:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9541/10070 [4:31:43<15:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9541/10070 [4:31:43<15:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9542/10070 [4:31:44<15:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9542/10070 [4:31:44<15:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9543/10070 [4:31:45<15:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9543/10070 [4:31:45<15:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9544/10070 [4:31:46<14:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9544/10070 [4:31:46<14:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9545/10070 [4:31:49<14:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9545/10070 [4:31:49<14:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9546/10070 [4:31:51<14:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9546/10070 [4:31:51<14:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9547/10070 [4:31:53<14:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9547/10070 [4:31:53<14:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9548/10070 [4:31:55<14:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9548/10070 [4:31:55<14:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9549/10070 [4:31:57<14:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9549/10070 [4:31:57<14:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9550/10070 [4:31:59<14:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9550/10070 [4:31:59<14:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9551/10070 [4:32:00<14:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9551/10070 [4:32:00<14:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9552/10070 [4:32:01<14:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9552/10070 [4:32:01<14:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9553/10070 [4:32:02<14:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9553/10070 [4:32:02<14:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9554/10070 [4:32:04<14:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9554/10070 [4:32:04<14:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9555/10070 [4:32:07<14:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9555/10070 [4:32:07<14:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9556/10070 [4:32:09<14:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9556/10070 [4:32:09<14:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9557/10070 [4:32:10<14:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9557/10070 [4:32:10<14:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9558/10070 [4:32:12<14:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9558/10070 [4:32:12<14:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9559/10070 [4:32:13<14:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9559/10070 [4:32:13<14:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9560/10070 [4:32:15<14:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9560/10070 [4:32:15<14:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9561/10070 [4:32:17<14:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9561/10070 [4:32:17<14:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9562/10070 [4:32:17<14:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9562/10070 [4:32:17<14:27,  1.71s/it, v_num=tif6, train/loss=9."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9563/10070 [4:32:19<14:26,  1.71s/it, v_num=tif6, train/loss=9.\r",
-      "Epoch 0:  95%|▉| 9563/10070 [4:32:19<14:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9564/10070 [4:32:21<14:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9564/10070 [4:32:21<14:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9565/10070 [4:32:22<14:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9565/10070 [4:32:22<14:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9566/10070 [4:32:23<14:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9566/10070 [4:32:23<14:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9567/10070 [4:32:25<14:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9567/10070 [4:32:25<14:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9568/10070 [4:32:33<14:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9568/10070 [4:32:33<14:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9569/10070 [4:32:34<14:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9569/10070 [4:32:34<14:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9570/10070 [4:32:35<14:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9570/10070 [4:32:35<14:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9571/10070 [4:32:36<14:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9571/10070 [4:32:36<14:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9572/10070 [4:32:36<14:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9572/10070 [4:32:36<14:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9573/10070 [4:32:37<14:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9573/10070 [4:32:37<14:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9574/10070 [4:32:39<14:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9574/10070 [4:32:39<14:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9575/10070 [4:32:40<14:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9575/10070 [4:32:40<14:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9576/10070 [4:32:41<14:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9576/10070 [4:32:41<14:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9577/10070 [4:32:42<14:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9577/10070 [4:32:42<14:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9578/10070 [4:32:44<14:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9578/10070 [4:32:44<14:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9579/10070 [4:32:46<13:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9579/10070 [4:32:46<13:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9580/10070 [4:32:47<13:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9580/10070 [4:32:47<13:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9581/10070 [4:32:48<13:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9581/10070 [4:32:48<13:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9582/10070 [4:32:49<13:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9582/10070 [4:32:49<13:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9583/10070 [4:32:49<13:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9583/10070 [4:32:49<13:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9584/10070 [4:32:50<13:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9584/10070 [4:32:50<13:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9585/10070 [4:32:51<13:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9585/10070 [4:32:51<13:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9586/10070 [4:32:53<13:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9586/10070 [4:32:53<13:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9587/10070 [4:32:55<13:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9587/10070 [4:32:55<13:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9588/10070 [4:32:55<13:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9588/10070 [4:32:55<13:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9589/10070 [4:32:57<13:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9589/10070 [4:32:57<13:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9590/10070 [4:32:59<13:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9590/10070 [4:32:59<13:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9591/10070 [4:33:00<13:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9591/10070 [4:33:00<13:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9592/10070 [4:33:01<13:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9592/10070 [4:33:01<13:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9593/10070 [4:33:04<13:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9593/10070 [4:33:04<13:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9594/10070 [4:33:05<13:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9594/10070 [4:33:05<13:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9595/10070 [4:33:06<13:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9595/10070 [4:33:06<13:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9596/10070 [4:33:09<13:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9596/10070 [4:33:09<13:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9597/10070 [4:33:09<13:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9597/10070 [4:33:09<13:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9598/10070 [4:33:11<13:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9598/10070 [4:33:11<13:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9599/10070 [4:33:12<13:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9599/10070 [4:33:12<13:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9600/10070 [4:33:25<13:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9600/10070 [4:33:25<13:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9601/10070 [4:33:47<13:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9601/10070 [4:33:47<13:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9602/10070 [4:33:48<13:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9602/10070 [4:33:48<13:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9603/10070 [4:33:49<13:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9603/10070 [4:33:49<13:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9604/10070 [4:33:50<13:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9604/10070 [4:33:50<13:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9605/10070 [4:33:51<13:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9605/10070 [4:33:51<13:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9606/10070 [4:33:53<13:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9606/10070 [4:33:53<13:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9607/10070 [4:33:54<13:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9607/10070 [4:33:54<13:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9608/10070 [4:33:55<13:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9608/10070 [4:33:55<13:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9609/10070 [4:33:56<13:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9609/10070 [4:33:56<13:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9610/10070 [4:33:57<13:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9610/10070 [4:33:57<13:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9611/10070 [4:33:58<13:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9611/10070 [4:33:58<13:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9612/10070 [4:34:00<13:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9612/10070 [4:34:00<13:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9613/10070 [4:34:02<13:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9613/10070 [4:34:02<13:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9614/10070 [4:34:03<12:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9614/10070 [4:34:03<12:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9615/10070 [4:34:05<12:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9615/10070 [4:34:05<12:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  95%|▉| 9616/10070 [4:34:07<12:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  95%|▉| 9616/10070 [4:34:07<12:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9617/10070 [4:34:08<12:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9617/10070 [4:34:08<12:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9618/10070 [4:34:09<12:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9618/10070 [4:34:09<12:53,  1.71s/it, v_num=tif6, train/loss=8."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9619/10070 [4:34:09<12:51,  1.71s/it, v_num=tif6, train/loss=8.\r",
-      "Epoch 0:  96%|▉| 9619/10070 [4:34:09<12:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9620/10070 [4:34:11<12:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9620/10070 [4:34:11<12:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9621/10070 [4:34:12<12:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9621/10070 [4:34:12<12:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9622/10070 [4:34:12<12:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9622/10070 [4:34:12<12:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9623/10070 [4:34:14<12:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9623/10070 [4:34:14<12:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9624/10070 [4:34:15<12:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9624/10070 [4:34:15<12:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9625/10070 [4:34:17<12:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9625/10070 [4:34:17<12:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9626/10070 [4:34:19<12:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9626/10070 [4:34:19<12:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9627/10070 [4:34:21<12:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9627/10070 [4:34:21<12:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9628/10070 [4:34:22<12:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9628/10070 [4:34:22<12:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9629/10070 [4:34:23<12:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9629/10070 [4:34:23<12:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9630/10070 [4:34:24<12:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9630/10070 [4:34:24<12:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9631/10070 [4:34:26<12:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9631/10070 [4:34:26<12:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9632/10070 [4:34:40<12:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9632/10070 [4:34:40<12:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9633/10070 [4:34:41<12:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9633/10070 [4:34:41<12:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9634/10070 [4:34:43<12:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9634/10070 [4:34:43<12:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9635/10070 [4:34:45<12:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9635/10070 [4:34:45<12:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9636/10070 [4:34:45<12:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9636/10070 [4:34:45<12:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9637/10070 [4:34:48<12:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9637/10070 [4:34:48<12:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9638/10070 [4:34:48<12:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9638/10070 [4:34:48<12:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9639/10070 [4:34:49<12:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9639/10070 [4:34:49<12:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9640/10070 [4:34:50<12:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9640/10070 [4:34:50<12:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9641/10070 [4:34:51<12:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9641/10070 [4:34:51<12:13,  1.71s/it, v_num=tif6, train/loss=8."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9642/10070 [4:34:53<12:12,  1.71s/it, v_num=tif6, train/loss=8.\r",
-      "Epoch 0:  96%|▉| 9642/10070 [4:34:53<12:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9643/10070 [4:34:55<12:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9643/10070 [4:34:55<12:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9644/10070 [4:34:56<12:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9644/10070 [4:34:56<12:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9645/10070 [4:34:57<12:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9645/10070 [4:34:57<12:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9646/10070 [4:34:59<12:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9646/10070 [4:34:59<12:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9647/10070 [4:35:01<12:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9647/10070 [4:35:01<12:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9648/10070 [4:35:02<12:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9648/10070 [4:35:02<12:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9649/10070 [4:35:03<12:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9649/10070 [4:35:03<12:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9650/10070 [4:35:04<11:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9650/10070 [4:35:04<11:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9651/10070 [4:35:07<11:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9651/10070 [4:35:07<11:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9652/10070 [4:35:08<11:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9652/10070 [4:35:08<11:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9653/10070 [4:35:09<11:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9653/10070 [4:35:09<11:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9654/10070 [4:35:10<11:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9654/10070 [4:35:10<11:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9655/10070 [4:35:11<11:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9655/10070 [4:35:11<11:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9656/10070 [4:35:12<11:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9656/10070 [4:35:12<11:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9657/10070 [4:35:14<11:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9657/10070 [4:35:14<11:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9658/10070 [4:35:16<11:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9658/10070 [4:35:16<11:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9659/10070 [4:35:16<11:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9659/10070 [4:35:16<11:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9660/10070 [4:35:18<11:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9660/10070 [4:35:18<11:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9661/10070 [4:35:19<11:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9661/10070 [4:35:19<11:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9662/10070 [4:35:20<11:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9662/10070 [4:35:20<11:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9663/10070 [4:35:21<11:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9663/10070 [4:35:21<11:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9664/10070 [4:35:33<11:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9664/10070 [4:35:33<11:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9665/10070 [4:35:34<11:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9665/10070 [4:35:34<11:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9666/10070 [4:35:34<11:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9666/10070 [4:35:34<11:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9667/10070 [4:35:36<11:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9667/10070 [4:35:36<11:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9668/10070 [4:35:36<11:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9668/10070 [4:35:36<11:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9669/10070 [4:35:37<11:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9669/10070 [4:35:37<11:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9670/10070 [4:35:39<11:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9670/10070 [4:35:39<11:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9671/10070 [4:35:40<11:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9671/10070 [4:35:40<11:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9672/10070 [4:35:42<11:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9672/10070 [4:35:42<11:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9673/10070 [4:35:43<11:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9673/10070 [4:35:43<11:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9674/10070 [4:35:44<11:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9674/10070 [4:35:44<11:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9675/10070 [4:35:44<11:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9675/10070 [4:35:44<11:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9676/10070 [4:35:47<11:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9676/10070 [4:35:47<11:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9677/10070 [4:35:48<11:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9677/10070 [4:35:48<11:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9678/10070 [4:35:48<11:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9678/10070 [4:35:48<11:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9679/10070 [4:35:50<11:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9679/10070 [4:35:50<11:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9680/10070 [4:35:51<11:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9680/10070 [4:35:51<11:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9681/10070 [4:35:53<11:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9681/10070 [4:35:53<11:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9682/10070 [4:35:55<11:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9682/10070 [4:35:55<11:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9683/10070 [4:35:56<11:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9683/10070 [4:35:56<11:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9684/10070 [4:35:58<11:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9684/10070 [4:35:58<11:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9685/10070 [4:35:58<10:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9685/10070 [4:35:58<10:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9686/10070 [4:35:59<10:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9686/10070 [4:35:59<10:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9687/10070 [4:36:00<10:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9687/10070 [4:36:00<10:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9688/10070 [4:36:02<10:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9688/10070 [4:36:02<10:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9689/10070 [4:36:03<10:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9689/10070 [4:36:03<10:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9690/10070 [4:36:05<10:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9690/10070 [4:36:05<10:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9691/10070 [4:36:06<10:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9691/10070 [4:36:06<10:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9692/10070 [4:36:08<10:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9692/10070 [4:36:08<10:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9693/10070 [4:36:09<10:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9693/10070 [4:36:09<10:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9694/10070 [4:36:11<10:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9694/10070 [4:36:11<10:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9695/10070 [4:36:13<10:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9695/10070 [4:36:13<10:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9696/10070 [4:36:29<10:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9696/10070 [4:36:29<10:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9697/10070 [4:36:30<10:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9697/10070 [4:36:30<10:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9698/10070 [4:36:32<10:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9698/10070 [4:36:32<10:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9699/10070 [4:36:33<10:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9699/10070 [4:36:33<10:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9700/10070 [4:36:35<10:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9700/10070 [4:36:35<10:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9701/10070 [4:36:37<10:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9701/10070 [4:36:37<10:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9702/10070 [4:36:38<10:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9702/10070 [4:36:38<10:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9703/10070 [4:36:39<10:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9703/10070 [4:36:39<10:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9704/10070 [4:36:40<10:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9704/10070 [4:36:40<10:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9705/10070 [4:36:40<10:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9705/10070 [4:36:40<10:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9706/10070 [4:36:43<10:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9706/10070 [4:36:43<10:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9707/10070 [4:36:45<10:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9707/10070 [4:36:45<10:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9708/10070 [4:36:46<10:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9708/10070 [4:36:46<10:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9709/10070 [4:36:47<10:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9709/10070 [4:36:47<10:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9710/10070 [4:36:47<10:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9710/10070 [4:36:47<10:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9711/10070 [4:36:49<10:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9711/10070 [4:36:49<10:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9712/10070 [4:36:50<10:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9712/10070 [4:36:50<10:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9713/10070 [4:36:52<10:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9713/10070 [4:36:52<10:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9714/10070 [4:36:53<10:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9714/10070 [4:36:53<10:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9715/10070 [4:36:54<10:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9715/10070 [4:36:54<10:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9716/10070 [4:36:55<10:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9716/10070 [4:36:55<10:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  96%|▉| 9717/10070 [4:36:58<10:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  96%|▉| 9717/10070 [4:36:58<10:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9718/10070 [4:37:00<10:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9718/10070 [4:37:00<10:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9719/10070 [4:37:00<10:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9719/10070 [4:37:00<10:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9720/10070 [4:37:02<09:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9720/10070 [4:37:02<09:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9721/10070 [4:37:03<09:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9721/10070 [4:37:03<09:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9722/10070 [4:37:05<09:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9722/10070 [4:37:05<09:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9723/10070 [4:37:07<09:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9723/10070 [4:37:07<09:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9724/10070 [4:37:09<09:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9724/10070 [4:37:09<09:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9725/10070 [4:37:11<09:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9725/10070 [4:37:11<09:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9726/10070 [4:37:13<09:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9726/10070 [4:37:13<09:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9727/10070 [4:37:13<09:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9727/10070 [4:37:13<09:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9728/10070 [4:37:25<09:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9728/10070 [4:37:25<09:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9729/10070 [4:37:25<09:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9729/10070 [4:37:25<09:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9730/10070 [4:37:26<09:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9730/10070 [4:37:26<09:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9731/10070 [4:37:28<09:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9731/10070 [4:37:28<09:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9732/10070 [4:37:29<09:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9732/10070 [4:37:29<09:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9733/10070 [4:37:31<09:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9733/10070 [4:37:31<09:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9734/10070 [4:37:33<09:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9734/10070 [4:37:33<09:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9735/10070 [4:37:35<09:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9735/10070 [4:37:35<09:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9736/10070 [4:37:37<09:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9736/10070 [4:37:37<09:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9737/10070 [4:37:38<09:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9737/10070 [4:37:38<09:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9738/10070 [4:37:39<09:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9738/10070 [4:37:39<09:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9739/10070 [4:37:40<09:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9739/10070 [4:37:40<09:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9740/10070 [4:37:41<09:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9740/10070 [4:37:41<09:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9741/10070 [4:37:42<09:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9741/10070 [4:37:42<09:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9742/10070 [4:37:44<09:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9742/10070 [4:37:44<09:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9743/10070 [4:37:45<09:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9743/10070 [4:37:45<09:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9744/10070 [4:37:46<09:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9744/10070 [4:37:46<09:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9745/10070 [4:37:47<09:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9745/10070 [4:37:47<09:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9746/10070 [4:37:49<09:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9746/10070 [4:37:49<09:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9747/10070 [4:37:51<09:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9747/10070 [4:37:51<09:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9748/10070 [4:37:53<09:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9748/10070 [4:37:53<09:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9749/10070 [4:37:55<09:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9749/10070 [4:37:55<09:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9750/10070 [4:37:56<09:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9750/10070 [4:37:56<09:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9751/10070 [4:37:57<09:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9751/10070 [4:37:57<09:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9752/10070 [4:38:00<09:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9752/10070 [4:38:00<09:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9753/10070 [4:38:01<09:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9753/10070 [4:38:01<09:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9754/10070 [4:38:02<09:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9754/10070 [4:38:02<09:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9755/10070 [4:38:04<08:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9755/10070 [4:38:04<08:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9756/10070 [4:38:05<08:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9756/10070 [4:38:05<08:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9757/10070 [4:38:06<08:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9757/10070 [4:38:06<08:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9758/10070 [4:38:08<08:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9758/10070 [4:38:08<08:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9759/10070 [4:38:10<08:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9759/10070 [4:38:10<08:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9760/10070 [4:38:18<08:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9760/10070 [4:38:18<08:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9761/10070 [4:38:19<08:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9761/10070 [4:38:19<08:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9762/10070 [4:38:22<08:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9762/10070 [4:38:22<08:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9763/10070 [4:38:22<08:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9763/10070 [4:38:22<08:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9764/10070 [4:38:24<08:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9764/10070 [4:38:24<08:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9765/10070 [4:38:25<08:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9765/10070 [4:38:25<08:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9766/10070 [4:38:26<08:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9766/10070 [4:38:26<08:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9767/10070 [4:38:27<08:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9767/10070 [4:38:27<08:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9768/10070 [4:38:28<08:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9768/10070 [4:38:28<08:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9769/10070 [4:38:30<08:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9769/10070 [4:38:30<08:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9770/10070 [4:38:32<08:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9770/10070 [4:38:32<08:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9771/10070 [4:38:35<08:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9771/10070 [4:38:35<08:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9772/10070 [4:38:35<08:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9772/10070 [4:38:35<08:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9773/10070 [4:38:36<08:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9773/10070 [4:38:36<08:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9774/10070 [4:38:38<08:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9774/10070 [4:38:38<08:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9775/10070 [4:38:40<08:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9775/10070 [4:38:40<08:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9776/10070 [4:38:41<08:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9776/10070 [4:38:41<08:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9777/10070 [4:38:41<08:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|���| 9777/10070 [4:38:41<08:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9778/10070 [4:38:43<08:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9778/10070 [4:38:43<08:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9779/10070 [4:38:45<08:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9779/10070 [4:38:45<08:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9780/10070 [4:38:46<08:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9780/10070 [4:38:46<08:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9781/10070 [4:38:48<08:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9781/10070 [4:38:48<08:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9782/10070 [4:38:49<08:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9782/10070 [4:38:49<08:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9783/10070 [4:38:51<08:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9783/10070 [4:38:51<08:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9784/10070 [4:38:53<08:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9784/10070 [4:38:53<08:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9785/10070 [4:38:54<08:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9785/10070 [4:38:54<08:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9786/10070 [4:38:56<08:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9786/10070 [4:38:56<08:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9787/10070 [4:38:57<08:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9787/10070 [4:38:57<08:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9788/10070 [4:38:58<08:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9788/10070 [4:38:58<08:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9789/10070 [4:39:00<08:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9789/10070 [4:39:00<08:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9790/10070 [4:39:01<07:58,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9790/10070 [4:39:01<07:58,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9791/10070 [4:39:02<07:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9791/10070 [4:39:02<07:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9792/10070 [4:39:13<07:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9792/10070 [4:39:13<07:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9793/10070 [4:39:13<07:53,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9793/10070 [4:39:13<07:53,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9794/10070 [4:39:14<07:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9794/10070 [4:39:14<07:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9795/10070 [4:39:15<07:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9795/10070 [4:39:15<07:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9796/10070 [4:39:15<07:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9796/10070 [4:39:15<07:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9797/10070 [4:39:16<07:46,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9797/10070 [4:39:16<07:46,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9798/10070 [4:39:17<07:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9798/10070 [4:39:17<07:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9799/10070 [4:39:19<07:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9799/10070 [4:39:19<07:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9800/10070 [4:39:20<07:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9800/10070 [4:39:20<07:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9801/10070 [4:39:22<07:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9801/10070 [4:39:22<07:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9802/10070 [4:39:23<07:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9802/10070 [4:39:23<07:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9803/10070 [4:39:24<07:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9803/10070 [4:39:24<07:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9804/10070 [4:39:25<07:34,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9804/10070 [4:39:25<07:34,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9805/10070 [4:39:26<07:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9805/10070 [4:39:26<07:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9806/10070 [4:39:27<07:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9806/10070 [4:39:27<07:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9807/10070 [4:39:29<07:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9807/10070 [4:39:29<07:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9808/10070 [4:39:30<07:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9808/10070 [4:39:30<07:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9809/10070 [4:39:31<07:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9809/10070 [4:39:31<07:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9810/10070 [4:39:33<07:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9810/10070 [4:39:33<07:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9811/10070 [4:39:36<07:22,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9811/10070 [4:39:36<07:22,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9812/10070 [4:39:38<07:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9812/10070 [4:39:38<07:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9813/10070 [4:39:39<07:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9813/10070 [4:39:39<07:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9814/10070 [4:39:40<07:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9814/10070 [4:39:40<07:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9815/10070 [4:39:41<07:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9815/10070 [4:39:41<07:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9816/10070 [4:39:43<07:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9816/10070 [4:39:43<07:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9817/10070 [4:39:45<07:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9817/10070 [4:39:45<07:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  97%|▉| 9818/10070 [4:39:46<07:10,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  97%|▉| 9818/10070 [4:39:46<07:10,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9819/10070 [4:39:48<07:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9819/10070 [4:39:48<07:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9820/10070 [4:39:49<07:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9820/10070 [4:39:49<07:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9821/10070 [4:39:50<07:05,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9821/10070 [4:39:50<07:05,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9822/10070 [4:39:51<07:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9822/10070 [4:39:51<07:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9823/10070 [4:39:53<07:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9823/10070 [4:39:53<07:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9824/10070 [4:40:08<07:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9824/10070 [4:40:08<07:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9825/10070 [4:40:10<06:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9825/10070 [4:40:10<06:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9826/10070 [4:40:12<06:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9826/10070 [4:40:12<06:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9827/10070 [4:40:13<06:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9827/10070 [4:40:13<06:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9828/10070 [4:40:14<06:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9828/10070 [4:40:14<06:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9829/10070 [4:40:14<06:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9829/10070 [4:40:14<06:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9830/10070 [4:40:16<06:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9830/10070 [4:40:16<06:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9831/10070 [4:40:16<06:48,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9831/10070 [4:40:16<06:48,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9832/10070 [4:40:17<06:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9832/10070 [4:40:17<06:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9833/10070 [4:40:19<06:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9833/10070 [4:40:19<06:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9834/10070 [4:40:20<06:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9834/10070 [4:40:20<06:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9835/10070 [4:40:22<06:41,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9835/10070 [4:40:22<06:41,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9836/10070 [4:40:23<06:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9836/10070 [4:40:23<06:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9837/10070 [4:40:25<06:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9837/10070 [4:40:25<06:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9838/10070 [4:40:25<06:36,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9838/10070 [4:40:25<06:36,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9839/10070 [4:40:26<06:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9839/10070 [4:40:26<06:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9840/10070 [4:40:27<06:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9840/10070 [4:40:27<06:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9841/10070 [4:40:28<06:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9841/10070 [4:40:28<06:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9842/10070 [4:40:31<06:29,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9842/10070 [4:40:31<06:29,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9843/10070 [4:40:32<06:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9843/10070 [4:40:32<06:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9844/10070 [4:40:33<06:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9844/10070 [4:40:33<06:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9845/10070 [4:40:35<06:24,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9845/10070 [4:40:35<06:24,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9846/10070 [4:40:36<06:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9846/10070 [4:40:36<06:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9847/10070 [4:40:37<06:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9847/10070 [4:40:37<06:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9848/10070 [4:40:38<06:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9848/10070 [4:40:38<06:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9849/10070 [4:40:40<06:17,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9849/10070 [4:40:40<06:17,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9850/10070 [4:40:42<06:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9850/10070 [4:40:42<06:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9851/10070 [4:40:43<06:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9851/10070 [4:40:43<06:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9852/10070 [4:40:45<06:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9852/10070 [4:40:45<06:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9853/10070 [4:40:45<06:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9853/10070 [4:40:45<06:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9854/10070 [4:40:46<06:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9854/10070 [4:40:46<06:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9855/10070 [4:40:49<06:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9855/10070 [4:40:49<06:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9856/10070 [4:41:04<06:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9856/10070 [4:41:04<06:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9857/10070 [4:41:04<06:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9857/10070 [4:41:04<06:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9858/10070 [4:41:06<06:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9858/10070 [4:41:06<06:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9859/10070 [4:41:07<06:00,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9859/10070 [4:41:07<06:00,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9860/10070 [4:41:09<05:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9860/10070 [4:41:09<05:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9861/10070 [4:41:11<05:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9861/10070 [4:41:11<05:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9862/10070 [4:41:13<05:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9862/10070 [4:41:13<05:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9863/10070 [4:41:14<05:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9863/10070 [4:41:14<05:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9864/10070 [4:41:15<05:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9864/10070 [4:41:15<05:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9865/10070 [4:41:17<05:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9865/10070 [4:41:17<05:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9866/10070 [4:41:18<05:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9866/10070 [4:41:18<05:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9867/10070 [4:41:19<05:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9867/10070 [4:41:19<05:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9868/10070 [4:41:20<05:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9868/10070 [4:41:20<05:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9869/10070 [4:41:21<05:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9869/10070 [4:41:21<05:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9870/10070 [4:41:23<05:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9870/10070 [4:41:23<05:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9871/10070 [4:41:25<05:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9871/10070 [4:41:25<05:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9872/10070 [4:41:28<05:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9872/10070 [4:41:28<05:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9873/10070 [4:41:29<05:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9873/10070 [4:41:29<05:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9874/10070 [4:41:32<05:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9874/10070 [4:41:32<05:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9875/10070 [4:41:34<05:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9875/10070 [4:41:34<05:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9876/10070 [4:41:36<05:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9876/10070 [4:41:36<05:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9877/10070 [4:41:37<05:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9877/10070 [4:41:37<05:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9878/10070 [4:41:38<05:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9878/10070 [4:41:38<05:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9879/10070 [4:41:39<05:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9879/10070 [4:41:39<05:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9880/10070 [4:41:41<05:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9880/10070 [4:41:41<05:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9881/10070 [4:41:42<05:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9881/10070 [4:41:42<05:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9882/10070 [4:41:43<05:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9882/10070 [4:41:43<05:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9883/10070 [4:41:45<05:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9883/10070 [4:41:45<05:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9884/10070 [4:41:46<05:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9884/10070 [4:41:46<05:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9885/10070 [4:41:47<05:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9885/10070 [4:41:47<05:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9886/10070 [4:41:47<05:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9886/10070 [4:41:47<05:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9887/10070 [4:41:49<05:12,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9887/10070 [4:41:49<05:12,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9888/10070 [4:41:56<05:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9888/10070 [4:41:56<05:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9889/10070 [4:41:57<05:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9889/10070 [4:41:57<05:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9890/10070 [4:41:59<05:07,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9890/10070 [4:41:59<05:07,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9891/10070 [4:42:00<05:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9891/10070 [4:42:00<05:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9892/10070 [4:42:00<05:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9892/10070 [4:42:00<05:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9893/10070 [4:42:02<05:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9893/10070 [4:42:02<05:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9894/10070 [4:42:04<05:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9894/10070 [4:42:04<05:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9895/10070 [4:42:06<04:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9895/10070 [4:42:06<04:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9896/10070 [4:42:08<04:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9896/10070 [4:42:08<04:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9897/10070 [4:42:11<04:55,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9897/10070 [4:42:11<04:55,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9898/10070 [4:42:13<04:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9898/10070 [4:42:13<04:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9899/10070 [4:42:14<04:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9899/10070 [4:42:14<04:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9900/10070 [4:42:15<04:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9900/10070 [4:42:15<04:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9901/10070 [4:42:17<04:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9901/10070 [4:42:17<04:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9902/10070 [4:42:18<04:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9902/10070 [4:42:18<04:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9903/10070 [4:42:18<04:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9903/10070 [4:42:18<04:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9904/10070 [4:42:20<04:43,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9904/10070 [4:42:20<04:43,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9905/10070 [4:42:21<04:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9905/10070 [4:42:21<04:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9906/10070 [4:42:22<04:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9906/10070 [4:42:22<04:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9907/10070 [4:42:23<04:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9907/10070 [4:42:23<04:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9908/10070 [4:42:24<04:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9908/10070 [4:42:24<04:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9909/10070 [4:42:27<04:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9909/10070 [4:42:27<04:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9910/10070 [4:42:27<04:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9910/10070 [4:42:27<04:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9911/10070 [4:42:29<04:31,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9911/10070 [4:42:29<04:31,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9912/10070 [4:42:31<04:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9912/10070 [4:42:31<04:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9913/10070 [4:42:32<04:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9913/10070 [4:42:32<04:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9914/10070 [4:42:33<04:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9914/10070 [4:42:33<04:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9915/10070 [4:42:34<04:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9915/10070 [4:42:34<04:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9916/10070 [4:42:34<04:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9916/10070 [4:42:34<04:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9917/10070 [4:42:36<04:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9917/10070 [4:42:36<04:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  98%|▉| 9918/10070 [4:42:36<04:19,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  98%|▉| 9918/10070 [4:42:36<04:19,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9919/10070 [4:42:39<04:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9919/10070 [4:42:39<04:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9920/10070 [4:42:53<04:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9920/10070 [4:42:53<04:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9921/10070 [4:42:54<04:14,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9921/10070 [4:42:54<04:14,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9922/10070 [4:42:55<04:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9922/10070 [4:42:55<04:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9923/10070 [4:42:57<04:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9923/10070 [4:42:57<04:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9924/10070 [4:42:58<04:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9924/10070 [4:42:58<04:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9925/10070 [4:42:58<04:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9925/10070 [4:42:58<04:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9926/10070 [4:42:59<04:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9926/10070 [4:42:59<04:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9927/10070 [4:43:00<04:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9927/10070 [4:43:00<04:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9928/10070 [4:43:00<04:02,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9928/10070 [4:43:00<04:02,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9929/10070 [4:43:02<04:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9929/10070 [4:43:02<04:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9930/10070 [4:43:04<03:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9930/10070 [4:43:04<03:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9931/10070 [4:43:06<03:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9931/10070 [4:43:06<03:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9932/10070 [4:43:08<03:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9932/10070 [4:43:08<03:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9933/10070 [4:43:09<03:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9933/10070 [4:43:09<03:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9934/10070 [4:43:10<03:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9934/10070 [4:43:10<03:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9935/10070 [4:43:12<03:50,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9935/10070 [4:43:12<03:50,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9936/10070 [4:43:13<03:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9936/10070 [4:43:13<03:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9937/10070 [4:43:14<03:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9937/10070 [4:43:14<03:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9938/10070 [4:43:16<03:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9938/10070 [4:43:16<03:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9939/10070 [4:43:17<03:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9939/10070 [4:43:17<03:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9940/10070 [4:43:18<03:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9940/10070 [4:43:18<03:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9941/10070 [4:43:19<03:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9941/10070 [4:43:19<03:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9942/10070 [4:43:21<03:38,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9942/10070 [4:43:21<03:38,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9943/10070 [4:43:23<03:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9943/10070 [4:43:23<03:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9944/10070 [4:43:23<03:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9944/10070 [4:43:23<03:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9945/10070 [4:43:25<03:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9945/10070 [4:43:25<03:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9946/10070 [4:43:26<03:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9946/10070 [4:43:26<03:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9947/10070 [4:43:28<03:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9947/10070 [4:43:28<03:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9948/10070 [4:43:30<03:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9948/10070 [4:43:30<03:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9949/10070 [4:43:31<03:26,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9949/10070 [4:43:31<03:26,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9950/10070 [4:43:32<03:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9950/10070 [4:43:32<03:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9951/10070 [4:43:34<03:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9951/10070 [4:43:34<03:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9952/10070 [4:43:47<03:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9952/10070 [4:43:47<03:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9953/10070 [4:43:48<03:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9953/10070 [4:43:48<03:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9954/10070 [4:43:49<03:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9954/10070 [4:43:49<03:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9955/10070 [4:43:50<03:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9955/10070 [4:43:50<03:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9956/10070 [4:43:51<03:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9956/10070 [4:43:51<03:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9957/10070 [4:43:52<03:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9957/10070 [4:43:52<03:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9958/10070 [4:43:54<03:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9958/10070 [4:43:54<03:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9959/10070 [4:43:55<03:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9959/10070 [4:43:55<03:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9960/10070 [4:43:56<03:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9960/10070 [4:43:56<03:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9961/10070 [4:43:57<03:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9961/10070 [4:43:57<03:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9962/10070 [4:43:58<03:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9962/10070 [4:43:58<03:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9963/10070 [4:44:00<03:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9963/10070 [4:44:00<03:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9964/10070 [4:44:03<03:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9964/10070 [4:44:03<03:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9965/10070 [4:44:04<02:59,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9965/10070 [4:44:04<02:59,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9966/10070 [4:44:05<02:57,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9966/10070 [4:44:05<02:57,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9967/10070 [4:44:06<02:56,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9967/10070 [4:44:06<02:56,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9968/10070 [4:44:06<02:54,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9968/10070 [4:44:06<02:54,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9969/10070 [4:44:07<02:52,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9969/10070 [4:44:07<02:52,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9970/10070 [4:44:09<02:51,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9970/10070 [4:44:09<02:51,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9971/10070 [4:44:12<02:49,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9971/10070 [4:44:12<02:49,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9972/10070 [4:44:12<02:47,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9972/10070 [4:44:12<02:47,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9973/10070 [4:44:15<02:45,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9973/10070 [4:44:15<02:45,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9974/10070 [4:44:16<02:44,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9974/10070 [4:44:16<02:44,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9975/10070 [4:44:18<02:42,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9975/10070 [4:44:18<02:42,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9976/10070 [4:44:19<02:40,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9976/10070 [4:44:19<02:40,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9977/10070 [4:44:21<02:39,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9977/10070 [4:44:21<02:39,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9978/10070 [4:44:22<02:37,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9978/10070 [4:44:22<02:37,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9979/10070 [4:44:23<02:35,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9979/10070 [4:44:23<02:35,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9980/10070 [4:44:25<02:33,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9980/10070 [4:44:25<02:33,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9981/10070 [4:44:26<02:32,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9981/10070 [4:44:26<02:32,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9982/10070 [4:44:26<02:30,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9982/10070 [4:44:26<02:30,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9983/10070 [4:44:27<02:28,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9983/10070 [4:44:27<02:28,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9984/10070 [4:44:39<02:27,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9984/10070 [4:44:39<02:27,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9985/10070 [4:44:41<02:25,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9985/10070 [4:44:41<02:25,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9986/10070 [4:44:43<02:23,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9986/10070 [4:44:43<02:23,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9987/10070 [4:44:43<02:21,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9987/10070 [4:44:43<02:21,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9988/10070 [4:44:45<02:20,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9988/10070 [4:44:45<02:20,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9989/10070 [4:44:46<02:18,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9989/10070 [4:44:46<02:18,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9990/10070 [4:44:48<02:16,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9990/10070 [4:44:48<02:16,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9991/10070 [4:44:49<02:15,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9991/10070 [4:44:49<02:15,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9992/10070 [4:44:51<02:13,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9992/10070 [4:44:51<02:13,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9993/10070 [4:44:53<02:11,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9993/10070 [4:44:53<02:11,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9994/10070 [4:44:54<02:09,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9994/10070 [4:44:54<02:09,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9995/10070 [4:44:55<02:08,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9995/10070 [4:44:55<02:08,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9996/10070 [4:44:58<02:06,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9996/10070 [4:44:58<02:06,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9997/10070 [4:44:59<02:04,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9997/10070 [4:44:59<02:04,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9998/10070 [4:45:00<02:03,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9998/10070 [4:45:00<02:03,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 9999/10070 [4:45:01<02:01,  1.71s/it, v_num=tif6, train/loss=0.\r",
-      "Epoch 0:  99%|▉| 9999/10070 [4:45:01<02:01,  1.71s/it, v_num=tif6, train/loss=0."
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 10000/10070 [4:45:03<01:59,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0:  99%|▉| 10000/10070 [4:45:03<01:59,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 10001/10070 [4:45:04<01:58,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0:  99%|▉| 10001/10070 [4:45:04<01:58,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 10002/10070 [4:45:05<01:56,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0:  99%|▉| 10002/10070 [4:45:05<01:56,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 10003/10070 [4:45:07<01:54,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0:  99%|▉| 10003/10070 [4:45:07<01:54,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 10004/10070 [4:45:10<01:52,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0:  99%|▉| 10004/10070 [4:45:10<01:52,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 10005/10070 [4:45:11<01:51,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0:  99%|▉| 10005/10070 [4:45:11<01:51,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 10006/10070 [4:45:13<01:49,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0:  99%|▉| 10006/10070 [4:45:13<01:49,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 10007/10070 [4:45:15<01:47,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0:  99%|▉| 10007/10070 [4:45:15<01:47,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 10008/10070 [4:45:16<01:46,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0:  99%|▉| 10008/10070 [4:45:16<01:46,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 10009/10070 [4:45:17<01:44,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0:  99%|▉| 10009/10070 [4:45:17<01:44,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 10010/10070 [4:45:19<01:42,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0:  99%|▉| 10010/10070 [4:45:19<01:42,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 10011/10070 [4:45:19<01:40,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0:  99%|▉| 10011/10070 [4:45:19<01:40,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 10012/10070 [4:45:21<01:39,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0:  99%|▉| 10012/10070 [4:45:21<01:39,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 10013/10070 [4:45:22<01:37,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0:  99%|▉| 10013/10070 [4:45:22<01:37,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 10014/10070 [4:45:22<01:35,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0:  99%|▉| 10014/10070 [4:45:22<01:35,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 10015/10070 [4:45:24<01:34,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0:  99%|▉| 10015/10070 [4:45:24<01:34,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 10016/10070 [4:45:35<01:32,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0:  99%|▉| 10016/10070 [4:45:35<01:32,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 10017/10070 [4:45:36<01:30,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0:  99%|▉| 10017/10070 [4:45:36<01:30,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 10018/10070 [4:45:37<01:28,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0:  99%|▉| 10018/10070 [4:45:37<01:28,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0:  99%|▉| 10019/10070 [4:45:37<01:27,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0:  99%|▉| 10019/10070 [4:45:37<01:27,  1.71s/it, v_num=tif6, train/loss=9"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10020/10070 [4:45:38<01:25,  1.71s/it, v_num=tif6, train/loss=9\r",
-      "Epoch 0: 100%|▉| 10020/10070 [4:45:38<01:25,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10021/10070 [4:45:39<01:23,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10021/10070 [4:45:39<01:23,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10022/10070 [4:45:40<01:22,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10022/10070 [4:45:40<01:22,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10023/10070 [4:45:42<01:20,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10023/10070 [4:45:42<01:20,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10024/10070 [4:45:43<01:18,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10024/10070 [4:45:43<01:18,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10025/10070 [4:45:45<01:16,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10025/10070 [4:45:45<01:16,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10026/10070 [4:45:47<01:15,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10026/10070 [4:45:47<01:15,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10027/10070 [4:45:49<01:13,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10027/10070 [4:45:49<01:13,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10028/10070 [4:45:51<01:11,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10028/10070 [4:45:51<01:11,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10029/10070 [4:45:51<01:10,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10029/10070 [4:45:51<01:10,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10030/10070 [4:45:53<01:08,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10030/10070 [4:45:53<01:08,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10031/10070 [4:45:54<01:06,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10031/10070 [4:45:54<01:06,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10032/10070 [4:45:56<01:04,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10032/10070 [4:45:56<01:04,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10033/10070 [4:45:57<01:03,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10033/10070 [4:45:57<01:03,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10034/10070 [4:45:59<01:01,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10034/10070 [4:45:59<01:01,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10035/10070 [4:46:02<00:59,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10035/10070 [4:46:02<00:59,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10036/10070 [4:46:04<00:58,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10036/10070 [4:46:04<00:58,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10037/10070 [4:46:06<00:56,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10037/10070 [4:46:06<00:56,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10038/10070 [4:46:07<00:54,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10038/10070 [4:46:07<00:54,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10039/10070 [4:46:08<00:53,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10039/10070 [4:46:08<00:53,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10040/10070 [4:46:10<00:51,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10040/10070 [4:46:10<00:51,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10041/10070 [4:46:12<00:49,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10041/10070 [4:46:12<00:49,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10042/10070 [4:46:12<00:47,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10042/10070 [4:46:12<00:47,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10043/10070 [4:46:15<00:46,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10043/10070 [4:46:15<00:46,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10044/10070 [4:46:16<00:44,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10044/10070 [4:46:16<00:44,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10045/10070 [4:46:17<00:42,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10045/10070 [4:46:17<00:42,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10046/10070 [4:46:18<00:41,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10046/10070 [4:46:18<00:41,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10047/10070 [4:46:19<00:39,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10047/10070 [4:46:19<00:39,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10048/10070 [4:46:27<00:37,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10048/10070 [4:46:27<00:37,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10049/10070 [4:46:30<00:35,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10049/10070 [4:46:30<00:35,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10050/10070 [4:46:31<00:34,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10050/10070 [4:46:31<00:34,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10051/10070 [4:46:32<00:32,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10051/10070 [4:46:32<00:32,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10052/10070 [4:46:34<00:30,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10052/10070 [4:46:34<00:30,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10053/10070 [4:46:35<00:29,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10053/10070 [4:46:35<00:29,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10054/10070 [4:46:36<00:27,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10054/10070 [4:46:36<00:27,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10055/10070 [4:46:38<00:25,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10055/10070 [4:46:38<00:25,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10056/10070 [4:46:39<00:23,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10056/10070 [4:46:39<00:23,  1.71s/it, v_num=tif6, train/loss=8"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10057/10070 [4:46:41<00:22,  1.71s/it, v_num=tif6, train/loss=8\r",
-      "Epoch 0: 100%|▉| 10057/10070 [4:46:41<00:22,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10058/10070 [4:46:43<00:20,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10058/10070 [4:46:43<00:20,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10059/10070 [4:46:44<00:18,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10059/10070 [4:46:44<00:18,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10060/10070 [4:46:45<00:17,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10060/10070 [4:46:45<00:17,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10061/10070 [4:46:47<00:15,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10061/10070 [4:46:47<00:15,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10062/10070 [4:46:48<00:13,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10062/10070 [4:46:48<00:13,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10063/10070 [4:46:49<00:11,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10063/10070 [4:46:49<00:11,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10064/10070 [4:46:50<00:10,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10064/10070 [4:46:50<00:10,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10065/10070 [4:46:51<00:08,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10065/10070 [4:46:51<00:08,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10066/10070 [4:46:53<00:06,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10066/10070 [4:46:53<00:06,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10067/10070 [4:46:55<00:05,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10067/10070 [4:46:55<00:05,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10068/10070 [4:46:56<00:03,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10068/10070 [4:46:56<00:03,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|▉| 10069/10070 [4:46:58<00:01,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|▉| 10069/10070 [4:46:58<00:01,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Epoch 0: 100%|█| 10070/10070 [4:47:00<00:00,  1.71s/it, v_num=tif6, train/loss=0\r",
-      "Epoch 0: 100%|█| 10070/10070 [4:47:00<00:00,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation: 0it [00:00, ?it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Validation:   0%|                                        | 0/11 [00:00<?, ?it/s]\u001b[A\r\n",
-      "\r",
-      "Validation DataLoader 0:   0%|                           | 0/11 [00:00<?, ?it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:   9%|█▋                 | 1/11 [00:00<00:04,  2.16it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  18%|███▍               | 2/11 [00:01<00:05,  1.77it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  27%|█████▏             | 3/11 [00:01<00:04,  1.81it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  36%|██████▉            | 4/11 [00:02<00:04,  1.74it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  45%|████████▋          | 5/11 [00:02<00:03,  1.70it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r",
-      "Validation DataLoader 0:  55%|██████████▎        | 6/11 [00:03<00:03,  1.66it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  64%|████████████       | 7/11 [00:04<00:02,  1.69it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  73%|█████████████▊     | 8/11 [00:04<00:01,  1.62it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  82%|███████████████▌   | 9/11 [00:05<00:01,  1.56it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0:  91%|████████████████▎ | 10/11 [00:06<00:00,  1.59it/s]\u001b[A"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\r\n",
-      "\r",
-      "Validation DataLoader 0: 100%|██████████████████| 11/11 [00:06<00:00,  1.58it/s]\u001b[A\r",
-      "Epoch 0: 100%|█| 10070/10070 [4:47:08<00:00,  1.71s/it, v_num=tif6, train/loss=0\r\n",
-      "\r",
-      "                                                                                \u001b[A\r",
-      "Epoch 0: 100%|█| 10070/10070 [4:47:08<00:00,  1.71s/it, v_num=tif6, train/loss=0"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "`Trainer.fit` stopped: `max_epochs=1` reached.\r\n",
-      "\r",
-      "Epoch 0: 100%|█| 10070/10070 [4:47:23<00:00,  1.71s/it, v_num=tif6, train/loss=0\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\u001b[34m\u001b[1mwandb\u001b[0m: Waiting for W&B process to finish... \u001b[32m(success).\u001b[0m\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\u001b[34m\u001b[1mwandb\u001b[0m: \r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: Run history:\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:              batchidx ▁▁▁▁▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▅▅▅▅▅▅▆▆▆▆▆▇▇▇▇▇▇███\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:                 epoch ▁▁▁▁▁▁▁\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:           global_rank ▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:          real_ctx_len ██▆▇█▃▃▃▆▇▅█▆█▆▁▃▃▁▃▂▄▅▂█▄▇▂▄▂▇▂▁▆▅▂▅▇▃▂\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:               substep ▁▁▁▁▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▅▅▅▅▅▅▆▆▆▆▆▇▇▇▇▇▇███\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:            train/loss █▇▄▄▄▁▁▂▁▁▁▁▁▁▂▂▂▂▁▁▁▂▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:   trainer/global_step ▁▁▁▁▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▅▅▅▅▅▅▆▆▆▆▆▇▇▇▇▇▇███\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: trainer/learning_rate ████▇▇▇▇▇▆▆▆▆▆▆▅▅▅▅▅▄▄▄▄▄▄▃▃▃▃▃▂▂▂▂▂▂▁▁▁\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:       validation/loss ▁\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: \r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: Run summary:\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:              batchidx 10\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:                 epoch 0\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:           global_rank 0\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:          real_ctx_len 1314\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:               substep 80\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:            train/loss 0.06128\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:   trainer/global_step 314\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: trainer/learning_rate 0.0001\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m:       validation/loss 0.07443\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: \r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: 🚀 View run \u001b[33mv5-L96-D1024-E0.1 - Mem-Tune ctx-2k (train-ctx=2k, deepspeed_stage_1)\u001b[0m at: \u001b[34m\u001b[4mhttps://wandb.ai/rwkv-x-dev/RWKV-X-Experiments/runs/ztpntif6\u001b[0m\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: ️⚡ View job at \u001b[34m\u001b[4mhttps://wandb.ai/rwkv-x-dev/RWKV-X-Experiments/jobs/QXJ0aWZhY3RDb2xsZWN0aW9uOjkzMjg5ODA3/version_details/v15\u001b[0m\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: Synced 5 W&B file(s), 0 media file(s), 0 artifact file(s) and 0 other file(s)\r\n",
-      "\u001b[34m\u001b[1mwandb\u001b[0m: Find logs at: \u001b[35m\u001b[1m./wandb/run-20230901_025548-ztpntif6/logs\u001b[0m\r\n"
-     ]
-    }
-   ],
-   "source": [
-    "# Start the finetune model training\n",
-    "!cd \"{TRAINER_DIR}\" && \\\n",
-    "    export WANDB_MODE=\"{WANDB_MODE}\" && \\\n",
-    "    export RWKV_WAVENET_LAYERS=\"{RWKV_WAVENET_LAYERS}\" && \\\n",
-    "    python lightning_trainer.py fit \\\n",
-    "        -c \"{NOTEBOOK_DIR}/config-mem-template.yaml\" \\\n",
-    "        --trainer.logger.init_args.name=\"{WANDB_PREFIX} - Mem-Tune ctx-2k (train-ctx=2k, {DEEPSPEED_STRAT})\" \\\n",
-    "        --trainer.strategy=\"{DEEPSPEED_STRAT}\" \\\n",
-    "        --trainer.devices=\"{GPU_DEVICES}\"  \\\n",
-    "        --trainer.callbacks.init_args.dirpath=\"../checkpoint/{FILENAME_PREFIX}-mem-ctx-2k/\" \\\n",
-    "        --model.lr_init=3e-4 \\\n",
-    "        --model.lr_final=1e-4 \\\n",
-    "        --data.max_token_size=2048 \\\n",
-    "        --model.ctx_len=2048 \\\n",
-    "        --model.bptt_learning_range=1 \\\n",
-    "        --model.load_model=\"../model/{FILENAME_PREFIX}-mem-ctx-1k.pth\""
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 11,
-   "id": "267b8d05",
-   "metadata": {
-    "execution": {
-     "iopub.execute_input": "2023-09-01T07:50:46.390089Z",
-     "iopub.status.busy": "2023-09-01T07:50:46.389767Z",
-     "iopub.status.idle": "2023-09-01T07:51:02.689651Z",
-     "shell.execute_reply": "2023-09-01T07:51:02.688833Z"
-    },
-    "papermill": {
-     "duration": 18.013293,
-     "end_time": "2023-09-01T07:51:02.691298",
-     "exception": false,
-     "start_time": "2023-09-01T07:50:44.678005",
-     "status": "completed"
-    },
-    "tags": []
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Setting ds_accelerator to cuda (auto detect)\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Processing zero checkpoint '../checkpoint/v5-L96-D1024-E0_1-mem-ctx-2k/last.ckpt/checkpoint'\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Detected checkpoint of type zero stage ZeroStageEnum.optimizer_states, world_size: 8\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Parsing checkpoint created by deepspeed==0.9.3\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Reconstructed fp32 state dict with 1926 params 1412678656 elements\r\n",
-      "Saving bf16 state dict to ../model/v5-L96-D1024-E0_1-mem-ctx-2k.pth\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "-rw-r--r-- 1 root root 2.7G Sep  1 07:51 ../model/v5-L96-D1024-E0_1-mem-ctx-2k.pth\r\n"
-     ]
-    }
-   ],
-   "source": [
-    "# Lets export the model from the checkpoint\n",
-    "!cd \"{TRAINER_DIR}\" && \\\n",
-    "    python export_checkpoint.py \\\n",
-    "        \"../checkpoint/{FILENAME_PREFIX}-mem-ctx-2k/last.ckpt\" \\\n",
-    "        \"../model/{FILENAME_PREFIX}-mem-ctx-2k.pth\" \"bf16\"\n",
-    "!cd \"{TRAINER_DIR}\" && ls -alh \"../model/{FILENAME_PREFIX}-mem-ctx-2k.pth\""
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 12,
-   "id": "5a6f5dd8",
-   "metadata": {
-    "execution": {
-     "iopub.execute_input": "2023-09-01T07:51:06.031180Z",
-     "iopub.status.busy": "2023-09-01T07:51:06.030908Z",
-     "iopub.status.idle": "2023-09-01T07:52:48.549611Z",
-     "shell.execute_reply": "2023-09-01T07:52:48.548521Z"
-    },
-    "papermill": {
-     "duration": 104.100549,
-     "end_time": "2023-09-01T07:52:48.551404",
-     "exception": false,
-     "start_time": "2023-09-01T07:51:04.450855",
-     "status": "completed"
-    },
-    "tags": []
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Setting ds_accelerator to cuda (auto detect)\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "[RWKV.model] Running RWKV model using 'torch-jit' with torch '2.0.1+cu118'\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "###\r\n",
-      "### Model validation start ###\r\n",
-      "###\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 5 tokens : 100.0% similarity, with 5 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 10 tokens : 100.0% similarity, with 10 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 15 tokens : 100.0% similarity, with 15 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 20 tokens : 100.0% similarity, with 20 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 25 tokens : 100.0% similarity, with 25 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 30 tokens : 100.0% similarity, with 30 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 35 tokens : 100.0% similarity, with 35 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 40 tokens : 100.0% similarity, with 40 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 45 tokens : 100.0% similarity, with 45 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 50 tokens : 100.0% similarity, with 50 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 55 tokens : 100.0% similarity, with 55 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 60 tokens : 100.0% similarity, with 60 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 65 tokens : 100.0% similarity, with 65 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 70 tokens : 100.0% similarity, with 70 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 75 tokens : 100.0% similarity, with 75 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 80 tokens : 100.0% similarity, with 80 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 85 tokens : 100.0% similarity, with 85 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 90 tokens : 100.0% similarity, with 90 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 95 tokens : 100.0% similarity, with 95 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 100 tokens : 100.0% similarity, with 100 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 105 tokens : 100.0% similarity, with 105 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 110 tokens : 100.0% similarity, with 110 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 115 tokens : 100.0% similarity, with 115 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 120 tokens : 100.0% similarity, with 120 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 125 tokens : 100.0% similarity, with 125 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 130 tokens : 100.0% similarity, with 130 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 135 tokens : 100.0% similarity, with 135 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 140 tokens : 100.0% similarity, with 140 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 145 tokens : 100.0% similarity, with 145 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 150 tokens : 100.0% similarity, with 150 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 160 tokens : 100.0% similarity, with 160 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 170 tokens : 100.0% similarity, with 170 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 180 tokens : 100.0% similarity, with 180 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 190 tokens : 100.0% similarity, with 190 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 200 tokens : 100.0% similarity, with 200 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 210 tokens : 100.0% similarity, with 210 matched token, and 0 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 220 tokens : 99.54545454545455% similarity, with 219 matched token, and 1 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 230 tokens : 99.1304347826087% similarity, with 228 matched token, and 2 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 240 tokens : 99.16666666666667% similarity, with 238 matched token, and 2 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 250 tokens : 99.2% similarity, with 248 matched token, and 2 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 260 tokens : 98.84615384615385% similarity, with 257 matched token, and 3 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 270 tokens : 99.62962962962963% similarity, with 269 matched token, and 1 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 280 tokens : 99.28571428571429% similarity, with 278 matched token, and 2 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 290 tokens : 98.9655172413793% similarity, with 287 matched token, and 3 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 300 tokens : 99.0% similarity, with 297 matched token, and 3 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 325 tokens : 99.07692307692308% similarity, with 322 matched token, and 3 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 350 tokens : 99.14285714285714% similarity, with 347 matched token, and 3 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 375 tokens : 98.93333333333332% similarity, with 371 matched token, and 4 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 400 tokens : 99.25% similarity, with 397 matched token, and 3 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 425 tokens : 99.29411764705883% similarity, with 422 matched token, and 3 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 450 tokens : 98.88888888888889% similarity, with 445 matched token, and 5 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 475 tokens : 98.94736842105263% similarity, with 470 matched token, and 5 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 500 tokens : 98.2% similarity, with 491 matched token, and 9 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 525 tokens : 97.71428571428571% similarity, with 513 matched token, and 12 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 550 tokens : 98.0% similarity, with 539 matched token, and 11 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 575 tokens : 97.73913043478261% similarity, with 562 matched token, and 13 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 600 tokens : 98.0% similarity, with 588 matched token, and 12 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 625 tokens : 97.44% similarity, with 609 matched token, and 16 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 650 tokens : 97.6923076923077% similarity, with 635 matched token, and 15 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 675 tokens : 97.03703703703704% similarity, with 655 matched token, and 20 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 700 tokens : 97.28571428571429% similarity, with 681 matched token, and 19 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 750 tokens : 96.8% similarity, with 726 matched token, and 24 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 800 tokens : 95.25% similarity, with 762 matched token, and 38 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 850 tokens : 93.64705882352942% similarity, with 796 matched token, and 54 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 900 tokens : 92.11111111111111% similarity, with 829 matched token, and 71 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 950 tokens : 90.0% similarity, with 855 matched token, and 95 token mismatch\r\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "## Model validation for 1000 tokens : 86.1% similarity, with 861 matched token, and 139 token mismatch\r\n",
-      "###\r\n",
-      "### Model validation end ###\r\n",
-      "###\r\n"
-     ]
-    }
-   ],
-   "source": [
-    "# Lets do a quick memory test\n",
-    "!export RWKV_WAVENET_LAYERS=\"{RWKV_WAVENET_LAYERS}\" && \\\n",
-    "        python3 ../memory_script/eval_v5_memory_guided.py \"{PROJECT_DIR}/model/{FILENAME_PREFIX}-mem-ctx-2k.pth\""
-   ]
-  }
- ],
- "metadata": {
-  "kernelspec": {
-   "display_name": "Python 3 (ipykernel)",
-   "language": "python",
-   "name": "python3"
-  },
-  "language_info": {
-   "codemirror_mode": {
-    "name": "ipython",
-    "version": 3
-   },
-   "file_extension": ".py",
-   "mimetype": "text/x-python",
-   "name": "python",
-   "nbconvert_exporter": "python",
-   "pygments_lexer": "ipython3",
-   "version": "3.11.4"
-  },
-  "papermill": {
-   "default_parameters": {},
-   "duration": 35700.943408,
-   "end_time": "2023-09-01T07:52:50.557057",
-   "environment_variables": {},
-   "exception": null,
-   "input_path": "/actions-runner/_work/RWKV-infctx-trainer/RWKV-infctx-trainer/notebook/experiment/rwkv-x-exp/v5-memory/v5-L96-D1024-E1e-1-ctx4k-part3.ipynb",
-   "output_path": "/actions-runner/_work/RWKV-infctx-trainer/RWKV-infctx-trainer/output/experiment/rwkv-x-exp/v5-memory/v5-L96-D1024-E1e-1-ctx4k-part3.ipynb",
-   "parameters": {},
-   "start_time": "2023-08-31T21:57:49.613649",
-   "version": "2.4.0"
-  }
- },
- "nbformat": 4,
- "nbformat_minor": 5
-}
\ No newline at end of file