Spaces:

harsh99
/

Virtual-Cloths-TryOn

Running

App Files Files Community

harsh99 commited on Jun 17

Commit

d1131f4

1 Parent(s): 76ee43d

bug fixes

Browse files

Files changed (1) hide show

training.ipynb +170 -565

training.ipynb CHANGED Viewed

@@ -11,12 +11,12 @@
      "output_type": "stream",
      "text": [
       "Cloning into 'stable-diffusion'...\n",
-      "remote: Enumerating objects: 156, done.\u001b[K\n",
-      "remote: Counting objects: 100% (156/156), done.\u001b[K\n",
-      "remote: Compressing objects: 100% (129/129), done.\u001b[K\n",
-      "remote: Total 156 (delta 41), reused 141 (delta 27), pack-reused 0 (from 0)\u001b[K\n",
-      "Receiving objects: 100% (156/156), 9.12 MiB | 37.38 MiB/s, done.\n",
-      "Resolving deltas: 100% (41/41), done.\n"
      ]
     }
    ],
@@ -70,25 +70,25 @@
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "--2025-06-16 17:29:32--  https://huggingface.co/sd-legacy/stable-diffusion-inpainting/resolve/main/sd-v1-5-inpainting.ckpt\n",
-      "Resolving huggingface.co (huggingface.co)... 18.239.50.103, 18.239.50.49, 18.239.50.16, ...\n",
-      "Connecting to huggingface.co (huggingface.co)|18.239.50.103|:443... connected.\n",
       "HTTP request sent, awaiting response... 307 Temporary Redirect\n",
       "Location: /stable-diffusion-v1-5/stable-diffusion-inpainting/resolve/main/sd-v1-5-inpainting.ckpt [following]\n",
-      "--2025-06-16 17:29:32--  https://huggingface.co/stable-diffusion-v1-5/stable-diffusion-inpainting/resolve/main/sd-v1-5-inpainting.ckpt\n",
       "Reusing existing connection to huggingface.co:443.\n",
       "HTTP request sent, awaiting response... 302 Found\n",
-      "Location: https://cdn-lfs.hf.co/repos/f6/56/f656f0fa3b8a40ac76d297fa2a4b00f981e8eb1261963460764e7dd3b35ec97f/c6bbc15e3224e6973459ba78de4998b80b50112b0ae5b5c67113d56b4e366b19?response-content-disposition=inline%3B+filename*%3DUTF-8%27%27sd-v1-5-inpainting.ckpt%3B+filename%3D%22sd-v1-5-inpainting.ckpt%22%3B&Expires=1750097473&Policy=eyJTdGF0ZW1lbnQiOlt7IkNvbmRpdGlvbiI6eyJEYXRlTGVzc1RoYW4iOnsiQVdTOkVwb2NoVGltZSI6MTc1MDA5NzQ3M319LCJSZXNvdXJjZSI6Imh0dHBzOi8vY2RuLWxmcy5oZi5jby9yZXBvcy9mNi81Ni9mNjU2ZjBmYTNiOGE0MGFjNzZkMjk3ZmEyYTRiMDBmOTgxZThlYjEyNjE5NjM0NjA3NjRlN2RkM2IzNWVjOTdmL2M2YmJjMTVlMzIyNGU2OTczNDU5YmE3OGRlNDk5OGI4MGI1MDExMmIwYWU1YjVjNjcxMTNkNTZiNGUzNjZiMTk%7EcmVzcG9uc2UtY29udGVudC1kaXNwb3NpdGlvbj0qIn1dfQ__&Signature=ixhNuL21wGqTYSmWbp-FTGAc-mnEAOyFNxhrmGSYcIj2jFokr-VLv3n46s1W3-d73DrLo%7EKYv1-vSbbTeJMf-q1drmOflxD-6HmdhijgDBedxnEcqrN%7EJ1vPLNTxQvveD2Sk%7Es6Zpdb045ylv7k8RRxqP4rdZtJRLLb6JK2wze-fu8LKBxUEVlTnPo4Mf6fo-cqhuP16GG384BlCT-HjlgM7urHKvH%7E5HAPxNmiqoMEyE7W7essWnpJYQxJKaG1U96CqHWXfGAP8HuzKqCGOpWwNPzHTIXhvOIOY7Gc%7EdDc91QBdknj%7EYaY6aGq%7E8VKou1PjmS0F1r6AQbm3JSexvw__&Key-Pair-Id=K3RPWS32NSSJCE [following]\n",
-      "--2025-06-16 17:29:32--  https://cdn-lfs.hf.co/repos/f6/56/f656f0fa3b8a40ac76d297fa2a4b00f981e8eb1261963460764e7dd3b35ec97f/c6bbc15e3224e6973459ba78de4998b80b50112b0ae5b5c67113d56b4e366b19?response-content-disposition=inline%3B+filename*%3DUTF-8%27%27sd-v1-5-inpainting.ckpt%3B+filename%3D%22sd-v1-5-inpainting.ckpt%22%3B&Expires=1750097473&Policy=eyJTdGF0ZW1lbnQiOlt7IkNvbmRpdGlvbiI6eyJEYXRlTGVzc1RoYW4iOnsiQVdTOkVwb2NoVGltZSI6MTc1MDA5NzQ3M319LCJSZXNvdXJjZSI6Imh0dHBzOi8vY2RuLWxmcy5oZi5jby9yZXBvcy9mNi81Ni9mNjU2ZjBmYTNiOGE0MGFjNzZkMjk3ZmEyYTRiMDBmOTgxZThlYjEyNjE5NjM0NjA3NjRlN2RkM2IzNWVjOTdmL2M2YmJjMTVlMzIyNGU2OTczNDU5YmE3OGRlNDk5OGI4MGI1MDExMmIwYWU1YjVjNjcxMTNkNTZiNGUzNjZiMTk%7EcmVzcG9uc2UtY29udGVudC1kaXNwb3NpdGlvbj0qIn1dfQ__&Signature=ixhNuL21wGqTYSmWbp-FTGAc-mnEAOyFNxhrmGSYcIj2jFokr-VLv3n46s1W3-d73DrLo%7EKYv1-vSbbTeJMf-q1drmOflxD-6HmdhijgDBedxnEcqrN%7EJ1vPLNTxQvveD2Sk%7Es6Zpdb045ylv7k8RRxqP4rdZtJRLLb6JK2wze-fu8LKBxUEVlTnPo4Mf6fo-cqhuP16GG384BlCT-HjlgM7urHKvH%7E5HAPxNmiqoMEyE7W7essWnpJYQxJKaG1U96CqHWXfGAP8HuzKqCGOpWwNPzHTIXhvOIOY7Gc%7EdDc91QBdknj%7EYaY6aGq%7E8VKou1PjmS0F1r6AQbm3JSexvw__&Key-Pair-Id=K3RPWS32NSSJCE\n",
-      "Resolving cdn-lfs.hf.co (cdn-lfs.hf.co)... 18.239.83.87, 18.239.83.31, 18.239.83.30, ...\n",
-      "Connecting to cdn-lfs.hf.co (cdn-lfs.hf.co)|18.239.83.87|:443... connected.\n",
       "HTTP request sent, awaiting response... 200 OK\n",
       "Length: 4265437280 (4.0G) [binary/octet-stream]\n",
       "Saving to: ‘sd-v1-5-inpainting.ckpt’\n",
       "\n",
-      "sd-v1-5-inpainting. 100%[===================>]   3.97G   307MB/s    in 11s     \n",
       "\n",
-      "2025-06-16 17:29:43 (372 MB/s) - ‘sd-v1-5-inpainting.ckpt’ saved [4265437280/4265437280]\n",
       "\n"
      ]
     }
@@ -99,7 +99,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 12,
    "id": "4c5198ca",
    "metadata": {},
    "outputs": [
@@ -107,11 +107,12 @@
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "attention.py  encoder.py\t  pipeline.py\t\t   test.ipynb\n",
-      "clip.py       interface.py\t  README.md\t\t   training.ipynb\n",
-      "ddpm.py       merges.txt\t  requirements.txt\t   utils.py\n",
-      "decoder.py    model_converter.py  sample_dataset\t   VITON_Dataset.py\n",
-      "diffusion.py  model.py\t\t  sd-v1-5-inpainting.ckpt  vocab.json\n"
      ]
     }
    ],
@@ -172,39 +173,6 @@
     "# !pip install -U --no-cache-dir gdown --pre"
    ]
   },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "id": "4467b7c7",
-   "metadata": {},
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "/usr/local/lib/python3.11/dist-packages/gdown/__main__.py:140: FutureWarning: Option `--id` was deprecated in version 4.3.1 and will be removed in 5.0. You don't need to pass it anymore to use a file ID.\n",
-      "  warnings.warn(\n",
-      "Failed to retrieve file url:\n",
-      "\n",
-      "\tToo many users have viewed or downloaded this file recently. Please\n",
-      "\ttry accessing the file again later. If the file you are trying to\n",
-      "\taccess is particularly large or is shared with many people, it may\n",
-      "\ttake up to 24 hours to be able to view or download the file. If you\n",
-      "\tstill can't access a file after 24 hours, contact your domain\n",
-      "\tadministrator.\n",
-      "\n",
-      "You may still be able to access the file from the browser:\n",
-      "\n",
-      "\thttps://drive.google.com/uc?id=1tLx8LRp-sxDp0EcYmYoV_vXdSc-jJ79w\n",
-      "\n",
-      "but Gdown can't. Please check connections and permissions.\n"
-     ]
-    }
-   ],
-   "source": [
-    "# !gdown --id 1tLx8LRp-sxDp0EcYmYoV_vXdSc-jJ79w\n"
-   ]
-  },
   {
    "cell_type": "code",
    "execution_count": null,
@@ -272,65 +240,26 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 5,
    "id": "53095103",
    "metadata": {},
-   "outputs": [],
-   "source": [
-    "!mkdir output\n",
-    "!mkdir checkpoints"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "id": "dcb8885d",
-   "metadata": {},
    "outputs": [
     {
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "Requirement already satisfied: diffusers in /usr/local/lib/python3.11/dist-packages (0.32.2)\n",
-      "Requirement already satisfied: importlib-metadata in /usr/local/lib/python3.11/dist-packages (from diffusers) (8.6.1)\n",
-      "Requirement already satisfied: filelock in /usr/local/lib/python3.11/dist-packages (from diffusers) (3.18.0)\n",
-      "Requirement already satisfied: huggingface-hub>=0.23.2 in /usr/local/lib/python3.11/dist-packages (from diffusers) (0.30.2)\n",
-      "Requirement already satisfied: numpy in /usr/local/lib/python3.11/dist-packages (from diffusers) (1.26.4)\n",
-      "Requirement already satisfied: regex!=2019.12.17 in /usr/local/lib/python3.11/dist-packages (from diffusers) (2024.11.6)\n",
-      "Requirement already satisfied: requests in /usr/local/lib/python3.11/dist-packages (from diffusers) (2.32.3)\n",
-      "Requirement already satisfied: safetensors>=0.3.1 in /usr/local/lib/python3.11/dist-packages (from diffusers) (0.5.2)\n",
-      "Requirement already satisfied: Pillow in /usr/local/lib/python3.11/dist-packages (from diffusers) (11.1.0)\n",
-      "Requirement already satisfied: fsspec>=2023.5.0 in /usr/local/lib/python3.11/dist-packages (from huggingface-hub>=0.23.2->diffusers) (2024.12.0)\n",
-      "Requirement already satisfied: packaging>=20.9 in /usr/local/lib/python3.11/dist-packages (from huggingface-hub>=0.23.2->diffusers) (24.2)\n",
-      "Requirement already satisfied: pyyaml>=5.1 in /usr/local/lib/python3.11/dist-packages (from huggingface-hub>=0.23.2->diffusers) (6.0.2)\n",
-      "Requirement already satisfied: tqdm>=4.42.1 in /usr/local/lib/python3.11/dist-packages (from huggingface-hub>=0.23.2->diffusers) (4.67.1)\n",
-      "Requirement already satisfied: typing-extensions>=3.7.4.3 in /usr/local/lib/python3.11/dist-packages (from huggingface-hub>=0.23.2->diffusers) (4.13.1)\n",
-      "Requirement already satisfied: zipp>=3.20 in /usr/local/lib/python3.11/dist-packages (from importlib-metadata->diffusers) (3.21.0)\n",
-      "Requirement already satisfied: mkl_fft in /usr/local/lib/python3.11/dist-packages (from numpy->diffusers) (1.3.8)\n",
-      "Requirement already satisfied: mkl_random in /usr/local/lib/python3.11/dist-packages (from numpy->diffusers) (1.2.4)\n",
-      "Requirement already satisfied: mkl_umath in /usr/local/lib/python3.11/dist-packages (from numpy->diffusers) (0.1.1)\n",
-      "Requirement already satisfied: mkl in /usr/local/lib/python3.11/dist-packages (from numpy->diffusers) (2025.1.0)\n",
-      "Requirement already satisfied: tbb4py in /usr/local/lib/python3.11/dist-packages (from numpy->diffusers) (2022.1.0)\n",
-      "Requirement already satisfied: mkl-service in /usr/local/lib/python3.11/dist-packages (from numpy->diffusers) (2.4.1)\n",
-      "Requirement already satisfied: charset-normalizer<4,>=2 in /usr/local/lib/python3.11/dist-packages (from requests->diffusers) (3.4.1)\n",
-      "Requirement already satisfied: idna<4,>=2.5 in /usr/local/lib/python3.11/dist-packages (from requests->diffusers) (3.10)\n",
-      "Requirement already satisfied: urllib3<3,>=1.21.1 in /usr/local/lib/python3.11/dist-packages (from requests->diffusers) (2.3.0)\n",
-      "Requirement already satisfied: certifi>=2017.4.17 in /usr/local/lib/python3.11/dist-packages (from requests->diffusers) (2025.1.31)\n",
-      "Requirement already satisfied: intel-openmp<2026,>=2024 in /usr/local/lib/python3.11/dist-packages (from mkl->numpy->diffusers) (2024.2.0)\n",
-      "Requirement already satisfied: tbb==2022.* in /usr/local/lib/python3.11/dist-packages (from mkl->numpy->diffusers) (2022.1.0)\n",
-      "Requirement already satisfied: tcmlib==1.* in /usr/local/lib/python3.11/dist-packages (from tbb==2022.*->mkl->numpy->diffusers) (1.2.0)\n",
-      "Requirement already satisfied: intel-cmplr-lib-rt in /usr/local/lib/python3.11/dist-packages (from mkl_umath->numpy->diffusers) (2024.2.0)\n",
-      "Requirement already satisfied: intel-cmplr-lib-ur==2024.2.0 in /usr/local/lib/python3.11/dist-packages (from intel-openmp<2026,>=2024->mkl->numpy->diffusers) (2024.2.0)\n"
      ]
     }
    ],
    "source": [
-    "!pip install diffusers"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 11,
    "id": "7efe325c",
    "metadata": {},
    "outputs": [],
@@ -352,7 +281,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 16,
    "id": "a48f2753",
    "metadata": {},
    "outputs": [
@@ -363,7 +292,7 @@
      "traceback": [
       "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m",
       "\u001b[0;31mKeyError\u001b[0m                                  Traceback (most recent call last)",
-      "\u001b[0;32m/tmp/ipykernel_71/1017109895.py\u001b[0m in \u001b[0;36m<cell line: 0>\u001b[0;34m()\u001b[0m\n\u001b[1;32m      3\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m      4\u001b[0m \u001b[0mtorch\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mcuda\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mempty_cache\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m  \u001b[0;31m# Release unused GPU memory\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m----> 5\u001b[0;31m \u001b[0mgc\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mcollect\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m              \u001b[0;31m# Run Python garbage collector\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m",
       "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/IPython/core/displayhook.py\u001b[0m in \u001b[0;36m__call__\u001b[0;34m(self, result)\u001b[0m\n\u001b[1;32m    261\u001b[0m             \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mwrite_output_prompt\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    262\u001b[0m             \u001b[0mformat_dict\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mmd_dict\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mcompute_format_data\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mresult\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 263\u001b[0;31m             \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mupdate_user_ns\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mresult\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m    264\u001b[0m             \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mfill_exec_result\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mresult\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    265\u001b[0m             \u001b[0;32mif\u001b[0m \u001b[0mformat_dict\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
       "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/IPython/core/displayhook.py\u001b[0m in \u001b[0;36mupdate_user_ns\u001b[0;34m(self, result)\u001b[0m\n\u001b[1;32m    199\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    200\u001b[0m         \u001b[0;31m# Avoid recursive reference when displaying _oh/Out\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 201\u001b[0;31m         \u001b[0;32mif\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mcache_size\u001b[0m \u001b[0;32mand\u001b[0m \u001b[0mresult\u001b[0m \u001b[0;32mis\u001b[0m \u001b[0;32mnot\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mshell\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0muser_ns\u001b[0m\u001b[0;34m[\u001b[0m\u001b[0;34m'_oh'\u001b[0m\u001b[0;34m]\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m    202\u001b[0m             \u001b[0;32mif\u001b[0m \u001b[0mlen\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mshell\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0muser_ns\u001b[0m\u001b[0;34m[\u001b[0m\u001b[0;34m'_oh'\u001b[0m\u001b[0;34m]\u001b[0m\u001b[0;34m)\u001b[0m \u001b[0;34m>=\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mcache_size\u001b[0m \u001b[0;32mand\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mdo_full_cache\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    203\u001b[0m                 \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mcull_cache\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
       "\u001b[0;31mKeyError\u001b[0m: '_oh'"
@@ -380,7 +309,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 17,
    "id": "5a57d765",
    "metadata": {},
    "outputs": [],
@@ -403,21 +332,10 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 14,
    "id": "5957ec57",
    "metadata": {},
-   "outputs": [
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "2025-06-16 17:40:54.825758: E external/local_xla/xla/stream_executor/cuda/cuda_fft.cc:477] Unable to register cuFFT factory: Attempting to register factory for plugin cuFFT when one has already been registered\n",
-      "WARNING: All log messages before absl::InitializeLog() is called are written to STDERR\n",
-      "E0000 00:00:1750095655.110921      71 cuda_dnn.cc:8310] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered\n",
-      "E0000 00:00:1750095655.201950      71 cuda_blas.cc:1418] Unable to register cuBLAS factory: Attempting to register factory for plugin cuBLAS when one has already been registered\n"
-     ]
-    }
-   ],
    "source": [
     "import tensorflow as tf\n",
     "tf.keras.backend.clear_session()"
@@ -425,7 +343,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 18,
    "id": "796e8ef7",
    "metadata": {},
    "outputs": [
@@ -450,7 +368,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 19,
    "id": "32ed173e",
    "metadata": {},
    "outputs": [
@@ -459,7 +377,7 @@
      "output_type": "stream",
      "text": [
       "Total RAM: 31.35 GB\n",
-      "Available RAM: 27.30 GB\n"
      ]
     }
    ],
@@ -483,7 +401,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 20,
    "id": "3ce888b6",
    "metadata": {},
    "outputs": [],
@@ -495,16 +413,14 @@
     "        (image_tensor.shape[0], 4, image_tensor.shape[2] // 8, image_tensor.shape[3] // 8),\n",
     "        device=device,\n",
     "    )\n",
-    "    \n",
-    "    # Encode using your custom encoder\n",
-    "    latent = encoder(image_tensor, encoder_noise)\n",
-    "    return latent"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 21,
-   "id": "081c5b70",
    "metadata": {},
    "outputs": [
     {
@@ -515,312 +431,24 @@
      ]
     },
     {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "/tmp/ipykernel_71/658570771.py:77: FutureWarning: `torch.cuda.amp.GradScaler(args...)` is deprecated. Please use `torch.amp.GradScaler('cuda', args...)` instead.\n",
-      "  self.scaler = torch.cuda.amp.GradScaler()\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Creating dataloaders...\n",
-      "Dataset vitonhd loaded, total 11647 pairs.\n",
-      "Training for 178 epochs (16000 steps)\n",
-      "Steps per epoch: 90\n",
-      "Total training steps: 16000\n",
-      "Total epochs: 178\n",
-      "Initializing trainer...\n",
-      "Enabling PEFT training (self-attention layers only)\n",
-      "Total parameters: 1,022,287,147\n",
-      "Trainable parameters: 6,554,880 (0.64%)\n",
-      "Warning: Expected ~49,570,000 trainable parameters, got 6,554,880\n",
-      "Starting training...\n",
-      "Starting training for 178 epochs\n",
-      "Total training steps: 2073166\n",
-      "Using DREAM with lambda = 0\n",
-      "Mixed precision: True\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "Epoch 1:   0%|          | 0/11647 [00:00<?, ?it/s]/tmp/ipykernel_71/658570771.py:292: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.\n",
-      "  with torch.cuda.amp.autocast():\n",
-      "/tmp/ipykernel_71/658570771.py:195: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.\n",
-      "  with torch.cuda.amp.autocast(enabled=self.use_mixed_precision):\n",
-      "Epoch 1:   0%|          | 1/11647 [00:09<29:46:54,  9.21s/it, loss=1.88, lr=1e-5, step=0]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Checkpoint saved: checkpoints/checkpoint_step_0.pth\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "Epoch 1:   0%|          | 2/11647 [00:16<26:03:12,  8.05s/it, loss=2.69, lr=1e-5, step=0]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Checkpoint saved: checkpoints/checkpoint_step_0.pth\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "Epoch 1:   0%|          | 3/11647 [00:23<24:01:31,  7.43s/it, loss=1.63, lr=1e-5, step=0]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Checkpoint saved: checkpoints/checkpoint_step_0.pth\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "Epoch 1:   0%|          | 4/11647 [00:34<28:42:23,  8.88s/it, loss=1.67, lr=1e-5, step=0]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Checkpoint saved: checkpoints/checkpoint_step_0.pth\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "Epoch 1:   0%|          | 5/11647 [00:47<33:21:58, 10.32s/it, loss=2.06, lr=1e-5, step=0]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Checkpoint saved: checkpoints/checkpoint_step_0.pth\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "Epoch 1:   0%|          | 6/11647 [01:16<54:28:11, 16.84s/it, loss=2.37, lr=1e-5, step=0]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Checkpoint saved: checkpoints/checkpoint_step_0.pth\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "Epoch 1:   0%|          | 7/11647 [01:22<43:07:22, 13.34s/it, loss=2.64, lr=1e-5, step=0]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Checkpoint saved: checkpoints/checkpoint_step_0.pth\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "Epoch 1:   0%|          | 8/11647 [01:39<46:12:47, 14.29s/it, loss=2.49, lr=1e-5, step=0]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Checkpoint saved: checkpoints/checkpoint_step_0.pth\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "Epoch 1:   0%|          | 9/11647 [01:45<38:37:52, 11.95s/it, loss=1.77, lr=1e-5, step=0]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Checkpoint saved: checkpoints/checkpoint_step_0.pth\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "Epoch 1:   0%|          | 10/11647 [01:57<37:48:49, 11.70s/it, loss=2.18, lr=1e-5, step=0]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Checkpoint saved: checkpoints/checkpoint_step_0.pth\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "Epoch 1:   0%|          | 11/11647 [02:20<49:32:59, 15.33s/it, loss=3.05, lr=1e-5, step=0]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Checkpoint saved: checkpoints/checkpoint_step_0.pth\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "Epoch 1:   0%|          | 12/11647 [02:28<41:54:59, 12.97s/it, loss=2.02, lr=1e-5, step=0]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Checkpoint saved: checkpoints/checkpoint_step_0.pth\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "Epoch 1:   0%|          | 13/11647 [02:41<42:09:43, 13.05s/it, loss=2.42, lr=1e-5, step=0]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Checkpoint saved: checkpoints/checkpoint_step_0.pth\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "Epoch 1:   0%|          | 14/11647 [02:53<41:07:53, 12.73s/it, loss=1.64, lr=1e-5, step=0]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Checkpoint saved: checkpoints/checkpoint_step_0.pth\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "Epoch 1:   0%|          | 15/11647 [03:06<41:56:49, 12.98s/it, loss=1.75, lr=1e-5, step=0]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Checkpoint saved: checkpoints/checkpoint_step_0.pth\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "Epoch 1:   0%|          | 16/11647 [03:20<42:46:06, 13.24s/it, loss=2.43, lr=1e-5, step=0]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Checkpoint saved: checkpoints/checkpoint_step_0.pth\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "Epoch 1:   0%|          | 17/11647 [03:43<51:45:46, 16.02s/it, loss=1.81, lr=1e-5, step=0]"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Checkpoint saved: checkpoints/checkpoint_step_0.pth\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "Epoch 1:   0%|          | 17/11647 [03:43<42:31:35, 13.16s/it, loss=1.81, lr=1e-5, step=0]\n"
-     ]
-    },
-    {
-     "ename": "KeyboardInterrupt",
-     "evalue": "",
      "output_type": "error",
      "traceback": [
       "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m",
-      "\u001b[0;31mKeyboardInterrupt\u001b[0m                         Traceback (most recent call last)",
-      "\u001b[0;32m/tmp/ipykernel_71/658570771.py\u001b[0m in \u001b[0;36m<cell line: 0>\u001b[0;34m()\u001b[0m\n\u001b[1;32m    525\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    526\u001b[0m \u001b[0;32mif\u001b[0m \u001b[0m__name__\u001b[0m \u001b[0;34m==\u001b[0m \u001b[0;34m\"__main__\"\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 527\u001b[0;31m     \u001b[0mmain\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m",
-      "\u001b[0;32m/tmp/ipykernel_71/658570771.py\u001b[0m in \u001b[0;36mmain\u001b[0;34m()\u001b[0m\n\u001b[1;32m    522\u001b[0m     \u001b[0;31m# Start training\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    523\u001b[0m     \u001b[0mprint\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m\"Starting training...\"\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 524\u001b[0;31m     \u001b[0mtrainer\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mtrain\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m    525\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    526\u001b[0m \u001b[0;32mif\u001b[0m \u001b[0m__name__\u001b[0m \u001b[0;34m==\u001b[0m \u001b[0;34m\"__main__\"\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;32m/tmp/ipykernel_71/658570771.py\u001b[0m in \u001b[0;36mtrain\u001b[0;34m(self)\u001b[0m\n\u001b[1;32m    358\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    359\u001b[0m             \u001b[0;31m# Train\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 360\u001b[0;31m             \u001b[0mtrain_loss\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mtrain_epoch\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m    361\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    362\u001b[0m             \u001b[0mprint\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34mf\"Epoch {epoch+1}/{self.num_epochs}\"\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;32m/tmp/ipykernel_71/658570771.py\u001b[0m in \u001b[0;36mtrain_epoch\u001b[0;34m(self)\u001b[0m\n\u001b[1;32m    291\u001b[0m             \u001b[0;32mif\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0muse_mixed_precision\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    292\u001b[0m                 \u001b[0;32mwith\u001b[0m \u001b[0mtorch\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mcuda\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mamp\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mautocast\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 293\u001b[0;31m                     \u001b[0mloss\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mcompute_loss\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mbatch\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m    294\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    295\u001b[0m                 \u001b[0;31m# Scale loss for gradient accumulation\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;32m/tmp/ipykernel_71/658570771.py\u001b[0m in \u001b[0;36mcompute_loss\u001b[0;34m(self, batch)\u001b[0m\n\u001b[1;32m    269\u001b[0m             \u001b[0;32melse\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    270\u001b[0m                 \u001b[0;31m# Standard training without DREAM\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 271\u001b[0;31m                 predicted_noise = self.diffusion(\n\u001b[0m\u001b[1;32m    272\u001b[0m                     \u001b[0minpainting_latent_model_input\u001b[0m\u001b[0;34m,\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    273\u001b[0m                     \u001b[0mtimesteps_embedding\u001b[0m\u001b[0;34m,\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py\u001b[0m in \u001b[0;36m_wrapped_call_impl\u001b[0;34m(self, *args, **kwargs)\u001b[0m\n\u001b[1;32m   1734\u001b[0m             \u001b[0;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_compiled_call_impl\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m*\u001b[0m\u001b[0margs\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m**\u001b[0m\u001b[0mkwargs\u001b[0m\u001b[0;34m)\u001b[0m  \u001b[0;31m# type: ignore[misc]\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1735\u001b[0m         \u001b[0;32melse\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m-> 1736\u001b[0;31m             \u001b[0;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_call_impl\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m*\u001b[0m\u001b[0margs\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m**\u001b[0m\u001b[0mkwargs\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m   1737\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1738\u001b[0m     \u001b[0;31m# torchrec tests the code consistency with the following code\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py\u001b[0m in \u001b[0;36m_call_impl\u001b[0;34m(self, *args, **kwargs)\u001b[0m\n\u001b[1;32m   1745\u001b[0m                 \u001b[0;32mor\u001b[0m \u001b[0m_global_backward_pre_hooks\u001b[0m \u001b[0;32mor\u001b[0m \u001b[0m_global_backward_hooks\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1746\u001b[0m                 or _global_forward_hooks or _global_forward_pre_hooks):\n\u001b[0;32m-> 1747\u001b[0;31m             \u001b[0;32mreturn\u001b[0m \u001b[0mforward_call\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m*\u001b[0m\u001b[0margs\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m**\u001b[0m\u001b[0mkwargs\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m   1748\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1749\u001b[0m         \u001b[0mresult\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0;32mNone\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;32m/kaggle/working/stable-diffusion/diffusion.py\u001b[0m in \u001b[0;36mforward\u001b[0;34m(self, latent, time)\u001b[0m\n\u001b[1;32m    255\u001b[0m         \u001b[0mtime\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mtime_embedding\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mtime\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    256\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 257\u001b[0;31m         \u001b[0moutput\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0munet\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mlatent\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mtime\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m    258\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    259\u001b[0m         \u001b[0moutput\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mfinal\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0moutput\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py\u001b[0m in \u001b[0;36m_wrapped_call_impl\u001b[0;34m(self, *args, **kwargs)\u001b[0m\n\u001b[1;32m   1734\u001b[0m             \u001b[0;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_compiled_call_impl\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m*\u001b[0m\u001b[0margs\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m**\u001b[0m\u001b[0mkwargs\u001b[0m\u001b[0;34m)\u001b[0m  \u001b[0;31m# type: ignore[misc]\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1735\u001b[0m         \u001b[0;32melse\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m-> 1736\u001b[0;31m             \u001b[0;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_call_impl\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m*\u001b[0m\u001b[0margs\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m**\u001b[0m\u001b[0mkwargs\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m   1737\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1738\u001b[0m     \u001b[0;31m# torchrec tests the code consistency with the following code\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py\u001b[0m in \u001b[0;36m_call_impl\u001b[0;34m(self, *args, **kwargs)\u001b[0m\n\u001b[1;32m   1745\u001b[0m                 \u001b[0;32mor\u001b[0m \u001b[0m_global_backward_pre_hooks\u001b[0m \u001b[0;32mor\u001b[0m \u001b[0m_global_backward_hooks\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1746\u001b[0m                 or _global_forward_hooks or _global_forward_pre_hooks):\n\u001b[0;32m-> 1747\u001b[0;31m             \u001b[0;32mreturn\u001b[0m \u001b[0mforward_call\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m*\u001b[0m\u001b[0margs\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m**\u001b[0m\u001b[0mkwargs\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m   1748\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1749\u001b[0m         \u001b[0mresult\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0;32mNone\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;32m/kaggle/working/stable-diffusion/diffusion.py\u001b[0m in \u001b[0;36mforward\u001b[0;34m(self, x, time)\u001b[0m\n\u001b[1;32m    226\u001b[0m             \u001b[0;31m# Since we always concat with the skip connection of the encoder, the number of features increases before being sent to the decoder's layer\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    227\u001b[0m             \u001b[0mx\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mtorch\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mcat\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mx\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mskip_connections\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mpop\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mdim\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0;36m1\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 228\u001b[0;31m             \u001b[0mx\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mlayers\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mx\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mtime\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m    229\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    230\u001b[0m         \u001b[0;32mreturn\u001b[0m \u001b[0mx\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py\u001b[0m in \u001b[0;36m_wrapped_call_impl\u001b[0;34m(self, *args, **kwargs)\u001b[0m\n\u001b[1;32m   1734\u001b[0m             \u001b[0;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_compiled_call_impl\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m*\u001b[0m\u001b[0margs\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m**\u001b[0m\u001b[0mkwargs\u001b[0m\u001b[0;34m)\u001b[0m  \u001b[0;31m# type: ignore[misc]\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1735\u001b[0m         \u001b[0;32melse\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m-> 1736\u001b[0;31m             \u001b[0;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_call_impl\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m*\u001b[0m\u001b[0margs\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m**\u001b[0m\u001b[0mkwargs\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m   1737\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1738\u001b[0m     \u001b[0;31m# torchrec tests the code consistency with the following code\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py\u001b[0m in \u001b[0;36m_call_impl\u001b[0;34m(self, *args, **kwargs)\u001b[0m\n\u001b[1;32m   1745\u001b[0m                 \u001b[0;32mor\u001b[0m \u001b[0m_global_backward_pre_hooks\u001b[0m \u001b[0;32mor\u001b[0m \u001b[0m_global_backward_hooks\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1746\u001b[0m                 or _global_forward_hooks or _global_forward_pre_hooks):\n\u001b[0;32m-> 1747\u001b[0;31m             \u001b[0;32mreturn\u001b[0m \u001b[0mforward_call\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m*\u001b[0m\u001b[0margs\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m**\u001b[0m\u001b[0mkwargs\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m   1748\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1749\u001b[0m         \u001b[0mresult\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0;32mNone\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;32m/kaggle/working/stable-diffusion/diffusion.py\u001b[0m in \u001b[0;36mforward\u001b[0;34m(self, x, time)\u001b[0m\n\u001b[1;32m    127\u001b[0m         \u001b[0;32mfor\u001b[0m \u001b[0mlayer\u001b[0m \u001b[0;32min\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    128\u001b[0m             \u001b[0;32mif\u001b[0m \u001b[0misinstance\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mlayer\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mUNET_AttentionBlock\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 129\u001b[0;31m                 \u001b[0mx\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0mlayer\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mx\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m    130\u001b[0m             \u001b[0;32melif\u001b[0m \u001b[0misinstance\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mlayer\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mUNET_ResidualBlock\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    131\u001b[0m                 \u001b[0mx\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0mlayer\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mx\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mtime\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py\u001b[0m in \u001b[0;36m_wrapped_call_impl\u001b[0;34m(self, *args, **kwargs)\u001b[0m\n\u001b[1;32m   1734\u001b[0m             \u001b[0;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_compiled_call_impl\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m*\u001b[0m\u001b[0margs\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m**\u001b[0m\u001b[0mkwargs\u001b[0m\u001b[0;34m)\u001b[0m  \u001b[0;31m# type: ignore[misc]\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1735\u001b[0m         \u001b[0;32melse\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m-> 1736\u001b[0;31m             \u001b[0;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_call_impl\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m*\u001b[0m\u001b[0margs\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m**\u001b[0m\u001b[0mkwargs\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m   1737\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1738\u001b[0m     \u001b[0;31m# torchrec tests the code consistency with the following code\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py\u001b[0m in \u001b[0;36m_call_impl\u001b[0;34m(self, *args, **kwargs)\u001b[0m\n\u001b[1;32m   1745\u001b[0m                 \u001b[0;32mor\u001b[0m \u001b[0m_global_backward_pre_hooks\u001b[0m \u001b[0;32mor\u001b[0m \u001b[0m_global_backward_hooks\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1746\u001b[0m                 or _global_forward_hooks or _global_forward_pre_hooks):\n\u001b[0;32m-> 1747\u001b[0;31m             \u001b[0;32mreturn\u001b[0m \u001b[0mforward_call\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m*\u001b[0m\u001b[0margs\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m**\u001b[0m\u001b[0mkwargs\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m   1748\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1749\u001b[0m         \u001b[0mresult\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0;32mNone\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;32m/kaggle/working/stable-diffusion/diffusion.py\u001b[0m in \u001b[0;36mforward\u001b[0;34m(self, x)\u001b[0m\n\u001b[1;32m     86\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m     87\u001b[0m         \u001b[0mx\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mlayernorm_1\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mx\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m---> 88\u001b[0;31m         \u001b[0mx\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mattention_1\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mx\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m     89\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m     90\u001b[0m         \u001b[0mx\u001b[0m\u001b[0;34m+=\u001b[0m\u001b[0mresidue_short\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py\u001b[0m in \u001b[0;36m_wrapped_call_impl\u001b[0;34m(self, *args, **kwargs)\u001b[0m\n\u001b[1;32m   1734\u001b[0m             \u001b[0;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_compiled_call_impl\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m*\u001b[0m\u001b[0margs\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m**\u001b[0m\u001b[0mkwargs\u001b[0m\u001b[0;34m)\u001b[0m  \u001b[0;31m# type: ignore[misc]\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1735\u001b[0m         \u001b[0;32melse\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m-> 1736\u001b[0;31m             \u001b[0;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_call_impl\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m*\u001b[0m\u001b[0margs\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m**\u001b[0m\u001b[0mkwargs\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m   1737\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1738\u001b[0m     \u001b[0;31m# torchrec tests the code consistency with the following code\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py\u001b[0m in \u001b[0;36m_call_impl\u001b[0;34m(self, *args, **kwargs)\u001b[0m\n\u001b[1;32m   1745\u001b[0m                 \u001b[0;32mor\u001b[0m \u001b[0m_global_backward_pre_hooks\u001b[0m \u001b[0;32mor\u001b[0m \u001b[0m_global_backward_hooks\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1746\u001b[0m                 or _global_forward_hooks or _global_forward_pre_hooks):\n\u001b[0;32m-> 1747\u001b[0;31m             \u001b[0;32mreturn\u001b[0m \u001b[0mforward_call\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m*\u001b[0m\u001b[0margs\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m**\u001b[0m\u001b[0mkwargs\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m   1748\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1749\u001b[0m         \u001b[0mresult\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0;32mNone\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;32m/kaggle/working/stable-diffusion/attention.py\u001b[0m in \u001b[0;36mforward\u001b[0;34m(self, x, causal_mask)\u001b[0m\n\u001b[1;32m     41\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m     42\u001b[0m         \u001b[0;31m# Scaling by sqrt(d_head)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m---> 43\u001b[0;31m         \u001b[0mattention_weights\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mattention_weights\u001b[0m \u001b[0;34m/\u001b[0m \u001b[0mmath\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0msqrt\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0md_head\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m     44\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m     45\u001b[0m         \u001b[0;31m# Causal mask to prevent attending to future tokens\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
-      "\u001b[0;31mKeyboardInterrupt\u001b[0m: "
      ]
     }
    ],
@@ -846,12 +474,12 @@
     "\n",
     "# Import your custom modules\n",
     "from load_model import preload_models_from_standard_weights\n",
-    "from ddpm import DDPMSampler  # Fixed import\n",
     "from utils import check_inputs, get_time_embedding, prepare_image, prepare_mask_image\n",
     "from diffusers.utils.torch_utils import randn_tensor\n",
     "\n",
     "class CatVTONTrainer:\n",
-    "    \"\"\"CatVTON Training Class with PEFT, CFG and DREAM support\"\"\"\n",
     "    \n",
     "    def __init__(\n",
     "        self,\n",
@@ -859,19 +487,16 @@
     "        train_dataloader: DataLoader,\n",
     "        val_dataloader: Optional[DataLoader] = None,\n",
     "        device: str = \"cuda\",\n",
-    "        learning_rate: float = 1e-5,  # Updated to paper value\n",
-    "        num_epochs: int = 100,\n",
     "        save_steps: int = 1000,\n",
     "        output_dir: str = \"./checkpoints\",\n",
     "        cfg_dropout_prob: float = 0.1,\n",
-    "        guidance_scale: float = 2.5,\n",
-    "        num_inference_steps: int = 50,\n",
-    "        gradient_accumulation_steps: int = 1,\n",
     "        max_grad_norm: float = 1.0,\n",
     "        use_peft: bool = True,\n",
-    "        dream_lambda: float = 10.0,  # DREAM parameter\n",
     "        resume_from_checkpoint: Optional[str] = None,\n",
-    "        use_mixed_precision: bool = True,  # For memory optimization\n",
     "        height=512,\n",
     "        width=384,\n",
     "    ):\n",
@@ -885,15 +510,12 @@
     "        self.save_steps = save_steps\n",
     "        self.output_dir = Path(output_dir)\n",
     "        self.cfg_dropout_prob = cfg_dropout_prob\n",
-    "        self.guidance_scale = guidance_scale\n",
-    "        self.num_inference_steps = num_inference_steps\n",
-    "        self.gradient_accumulation_steps = gradient_accumulation_steps\n",
     "        self.max_grad_norm = max_grad_norm\n",
     "        self.use_peft = use_peft\n",
     "        self.dream_lambda = dream_lambda\n",
     "        self.use_mixed_precision = use_mixed_precision\n",
-    "        self.height=height\n",
-    "        self.width=width\n",
     "        self.generator = torch.Generator(device=device)\n",
     "        \n",
     "        # Create output directory\n",
@@ -914,20 +536,18 @@
     "        if resume_from_checkpoint:\n",
     "            self._load_checkpoint(resume_from_checkpoint)\n",
     "    \n",
-    "        self.encoder=self.models.get('encoder', None)\n",
-    "        self.decoder=self.models.get('decoder', None)\n",
-    "        self.diffusion=self.models.get('diffusion', None)\n",
     "\n",
     "        # Setup models and optimizers\n",
     "        self._setup_training()\n",
     "    \n",
     "    def _setup_training(self):\n",
     "        \"\"\"Setup models for training with PEFT\"\"\"\n",
-    "        # Move models to device with mixed precision\n",
     "        for name, model in self.models.items():\n",
     "            model.to(self.device)\n",
-    "            # if self.use_mixed_precision and name != 'encoder':  # Keep encoder in float32 for stability\n",
-    "            #     model.half()\n",
     "        \n",
     "        # Freeze all parameters first\n",
     "        for model in self.models.values():\n",
@@ -939,7 +559,7 @@
     "            self._enable_peft_training()\n",
     "        else:\n",
     "            # Enable full training for diffusion model\n",
-    "            for param in self.models['diffusion'].parameters():\n",
     "                param.requires_grad = True\n",
     "        \n",
     "        # Collect trainable parameters\n",
@@ -957,12 +577,6 @@
     "        print(f\"Total parameters: {total_params:,}\")\n",
     "        print(f\"Trainable parameters: {trainable_count:,} ({trainable_count/total_params*100:.2f}%)\")\n",
     "        \n",
-    "        # Verify we're close to the paper's 49.57M parameters for self-attention only\n",
-    "        if self.use_peft:\n",
-    "            expected_params = 49_570_000  # 49.57M\n",
-    "            if abs(trainable_count - expected_params) > 5_000_000:  # 5M tolerance\n",
-    "                print(f\"Warning: Expected ~{expected_params:,} trainable parameters, got {trainable_count:,}\")\n",
-    "        \n",
     "        # Setup optimizer - AdamW as per paper\n",
     "        self.optimizer = AdamW(\n",
     "            trainable_params,\n",
@@ -972,31 +586,31 @@
     "            eps=1e-8\n",
     "        )\n",
     "        \n",
-    "        # Setup learning rate scheduler (constant as per paper)\n",
-    "        # For constant LR, we can use a dummy scheduler\n",
     "        self.lr_scheduler = torch.optim.lr_scheduler.LambdaLR(\n",
     "            self.optimizer, lr_lambda=lambda epoch: 1.0\n",
     "        )\n",
     "    \n",
     "    def _enable_peft_training(self):\n",
-    "        \"\"\"Enable PEFT training - only self-attention layers (49.57M parameters)\"\"\"\n",
     "        print(\"Enabling PEFT training (self-attention layers only)\")\n",
     "        \n",
     "        unet = self.diffusion.unet\n",
     "        \n",
-    "        # Enable attention layers in encoders\n",
     "        for layers in [unet.encoders, unet.decoders]:\n",
     "            for layer in layers:\n",
-    "                if hasattr(layer, 'attention_1'):  # Alternative naming\n",
-    "                    for param in layer.attention_1.parameters():\n",
-    "                        param.requires_grad = True\n",
-    "        \n",
     "        # Enable attention layers in bottleneck\n",
     "        for layer in unet.bottleneck:\n",
-    "            if hasattr(layer, 'attention_1'):\n",
-    "                for param in layer.attention_1.parameters():\n",
     "                    param.requires_grad = True\n",
-    "    \n",
     "    def _apply_cfg_dropout(self, garment_latent: torch.Tensor) -> torch.Tensor:\n",
     "        \"\"\"Apply classifier-free guidance dropout (10% chance)\"\"\"\n",
     "        if self.training and random.random() < self.cfg_dropout_prob:\n",
@@ -1010,33 +624,35 @@
     "        cloth_images = batch['cloth'].to(self.device)\n",
     "        masks = batch['mask'].to(self.device)\n",
     "\n",
-    "        concat_dim = -2  # FIXME: y axis concat\n",
-    "        # Prepare inputs to Tensor\n",
     "        image, condition_image, mask = check_inputs(person_images, cloth_images, masks, self.width, self.height)\n",
     "        image = prepare_image(person_images).to(self.device, dtype=self.weight_dtype)\n",
     "        condition_image = prepare_image(cloth_images).to(self.device, dtype=self.weight_dtype)\n",
     "        mask = prepare_mask_image(masks).to(self.device, dtype=self.weight_dtype)\n",
     "        # Mask image\n",
     "        masked_image = image * (mask < 0.5)\n",
     "\n",
     "        with torch.cuda.amp.autocast(enabled=self.use_mixed_precision):\n",
-    "        # VAE encoding\n",
     "            masked_latent = compute_vae_encodings(masked_image, self.encoder)\n",
     "            person_latent = compute_vae_encodings(person_images, self.encoder)\n",
     "            condition_latent = compute_vae_encodings(condition_image, self.encoder)\n",
     "            mask_latent = torch.nn.functional.interpolate(mask, size=masked_latent.shape[-2:], mode=\"nearest\")\n",
     "            del image, mask, condition_image\n",
     "\n",
-    "\n",
     "            # Apply CFG dropout to garment latent\n",
     "            condition_latent = self._apply_cfg_dropout(condition_latent)\n",
     "            \n",
     "            # Concatenate latents\n",
     "            masked_latent_concat = torch.cat([masked_latent, condition_latent], dim=concat_dim)\n",
     "            mask_latent_concat = torch.cat([mask_latent, torch.zeros_like(mask_latent)], dim=concat_dim)\n",
-    "            target_latents=torch.cat([person_latent, condition_latent], dim=concat_dim)\n",
     "\n",
-    "            noise=randn_tensor(\n",
     "                masked_latent_concat.shape,\n",
     "                generator=self.generator,\n",
     "                device=masked_latent_concat.device,\n",
@@ -1061,11 +677,9 @@
     "                # Get initial noise prediction\n",
     "                with torch.no_grad():\n",
     "                    epsilon_theta = self.diffusion(\n",
-    "                    inpainting_latent_model_input,\n",
-    "                    timesteps_embedding\n",
-    "                )\n",
-    "\n",
-    "                # print(f\"Predicted noise shape: {epsilon_theta.shape}\")\n",
     "                \n",
     "                # Apply DREAM: zˆt = √αt*z0 + √(1-αt)*(ε + λ*εθ)\n",
     "                alphas_cumprod = self.scheduler.alphas_cumprod.to(device=self.device, dtype=self.weight_dtype)\n",
@@ -1087,7 +701,7 @@
     "                    masked_latent_concat\n",
     "                ], dim=1)\n",
     "\n",
-    "                predicted_noise= self.diffusion(\n",
     "                    dream_model_input,\n",
     "                    timesteps_embedding\n",
     "                )\n",
@@ -1106,64 +720,61 @@
     "        return loss\n",
     "    \n",
     "    def train_epoch(self) -> float:\n",
-    "        \"\"\"Train for one epoch\"\"\"\n",
-    "        self.models['diffusion'].train()\n",
     "        total_loss = 0.0\n",
     "        num_batches = len(self.train_dataloader)\n",
     "        \n",
     "        progress_bar = tqdm(self.train_dataloader, desc=f\"Epoch {self.current_epoch+1}\")\n",
     "        \n",
     "        for step, batch in enumerate(progress_bar):\n",
-    "            # Compute loss with mixed precision\n",
     "            if self.use_mixed_precision:\n",
     "                with torch.cuda.amp.autocast():\n",
     "                    loss = self.compute_loss(batch)\n",
     "                \n",
-    "                # Scale loss for gradient accumulation\n",
-    "                loss = loss / self.gradient_accumulation_steps\n",
-    "                \n",
     "                # Backward pass with scaling\n",
     "                self.scaler.scale(loss).backward()\n",
     "            else:\n",
     "                loss = self.compute_loss(batch)\n",
-    "                loss = loss / self.gradient_accumulation_steps\n",
     "                loss.backward()\n",
-    "            \n",
-    "            # Gradient accumulation\n",
-    "            if (step + 1) % self.gradient_accumulation_steps == 0:\n",
-    "                if self.use_mixed_precision:\n",
-    "                    # Unscale gradients and clip\n",
-    "                    self.scaler.unscale_(self.optimizer)\n",
-    "                    torch.nn.utils.clip_grad_norm_(\n",
-    "                        [p for p in self.diffusion.parameters() if p.requires_grad],\n",
-    "                        self.max_grad_norm\n",
-    "                    )\n",
-    "                    \n",
-    "                    # Optimizer step with scaling\n",
-    "                    self.scaler.step(self.optimizer)\n",
-    "                    self.scaler.update()\n",
-    "                else:\n",
-    "                    # Clip gradients\n",
-    "                    torch.nn.utils.clip_grad_norm_(\n",
-    "                        [p for p in self.diffusion.parameters() if p.requires_grad],\n",
-    "                        self.max_grad_norm\n",
-    "                    )\n",
-    "                    self.optimizer.step()\n",
     "                \n",
-    "                self.lr_scheduler.step()\n",
-    "                self.optimizer.zero_grad()\n",
-    "                self.global_step += 1\n",
     "            \n",
-    "            total_loss += loss.item() * self.gradient_accumulation_steps\n",
     "            \n",
     "            # Update progress bar\n",
     "            progress_bar.set_postfix({\n",
-    "                'loss': loss.item() * self.gradient_accumulation_steps,\n",
     "                'lr': self.optimizer.param_groups[0]['lr'],\n",
     "                'step': self.global_step\n",
     "            })\n",
     "            \n",
-    "            # Save checkpoint\n",
     "            if self.global_step % self.save_steps == 0:\n",
     "                self._save_checkpoint()\n",
     "            \n",
@@ -1174,29 +785,32 @@
     "        return total_loss / num_batches\n",
     "    \n",
     "    def train(self):\n",
-    "        \"\"\"Main training loop\"\"\"\n",
     "        print(f\"Starting training for {self.num_epochs} epochs\")\n",
-    "        print(f\"Total training steps: {self.num_epochs * len(self.train_dataloader)}\")\n",
     "        print(f\"Using DREAM with lambda = {self.dream_lambda}\")\n",
     "        print(f\"Mixed precision: {self.use_mixed_precision}\")\n",
     "        \n",
     "        for epoch in range(self.current_epoch, self.num_epochs):\n",
     "            self.current_epoch = epoch\n",
     "            \n",
-    "            # Train\n",
     "            train_loss = self.train_epoch()\n",
     "            \n",
-    "            print(f\"Epoch {epoch+1}/{self.num_epochs}\")\n",
-    "            print(f\"Train Loss: {train_loss:.6f}\")\n",
     "            \n",
     "            # Save epoch checkpoint\n",
-    "            if (epoch + 1) % 10 == 0:\n",
     "                self._save_checkpoint(epoch_checkpoint=True)\n",
     "            \n",
     "            # Clear cache at end of epoch\n",
     "            torch.cuda.empty_cache()\n",
     "    \n",
-    "    def _save_checkpoint(self, is_best: bool = False, epoch_checkpoint: bool = False):\n",
     "        \"\"\"Save model checkpoint\"\"\"\n",
     "        checkpoint = {\n",
     "            'global_step': self.global_step,\n",
@@ -1211,7 +825,9 @@
     "        if self.use_mixed_precision:\n",
     "            checkpoint['scaler_state_dict'] = self.scaler.state_dict()\n",
     "        \n",
-    "        if is_best:\n",
     "            checkpoint_path = self.output_dir / \"best_model.pth\"\n",
     "        elif epoch_checkpoint:\n",
     "            checkpoint_path = self.output_dir / f\"checkpoint_epoch_{self.current_epoch+1}.pth\"\n",
@@ -1239,65 +855,57 @@
     "        print(f\"Checkpoint loaded: {checkpoint_path}\")\n",
     "        print(f\"Resuming from epoch {self.current_epoch}, step {self.global_step}\")\n",
     "\n",
-    "def create_dataloaders(args) -> Tuple[DataLoader, Optional[DataLoader]]:\n",
-    "    \"\"\"Create training and validation dataloaders\"\"\"\n",
-    "    # Dataset\n",
     "    if args.dataset_name == \"vitonhd\":\n",
     "        dataset = VITONHDTestDataset(args)\n",
     "    else:\n",
-    "        raise ValueError(f\"Invalid dataset name {args.dataset}.\")\n",
     "    print(f\"Dataset {args.dataset_name} loaded, total {len(dataset)} pairs.\")\n",
-    "\n",
     "    dataloader = DataLoader(\n",
     "        dataset,\n",
     "        batch_size=args.batch_size,\n",
-    "        shuffle=False,\n",
-    "        num_workers=args.dataloader_num_workers\n",
     "    )\n",
     "    \n",
     "    return dataloader\n",
     "\n",
     "\n",
     "def main():\n",
-    "    args=argparse.Namespace()\n",
-    "    args.__dict__= {\n",
     "        \"base_model_path\": \"sd-v1-5-inpainting.ckpt\",\n",
-    "        \"resume_path\": \"zhengchong/CatVTON\",\n",
     "        \"dataset_name\": \"vitonhd\",\n",
     "        \"data_root_path\": \"/kaggle/input/viton-hd-dataset\",\n",
-    "        \"output_dir\": \"./output\",\n",
     "        \"seed\": 42,\n",
     "        \"batch_size\": 1,\n",
-    "        \"num_inference_steps\": 50,\n",
-    "        \"guidance_scale\": 2.5,\n",
     "        \"width\": 384,\n",
     "        \"height\": 512,\n",
     "        \"repaint\": True,\n",
     "        \"eval_pair\": True,\n",
     "        \"concat_eval_results\": True,\n",
-    "        \"allow_tf32\": True,\n",
-    "        \"dataloader_num_workers\": 4,\n",
-    "        \"mixed_precision\": 'no',\n",
     "        \"concat_axis\": 'y',\n",
-    "        \"enable_condition_noise\": True,\n",
-    "        \"device\":\"cuda\",\n",
-    "        \"num_training_steps\": 16000,\n",
     "        \"learning_rate\": 1e-5,\n",
-    "        \"gradient_accumulation_steps\": 128,  # Simulate batch size 128\n",
     "        \"max_grad_norm\": 1.0,\n",
-    "        \"use_peft\": True,\n",
     "        \"cfg_dropout_prob\": 0.1,\n",
     "        \"dream_lambda\": 0,\n",
     "        \"use_mixed_precision\": True,\n",
-    "        \"output_dir\": \"./checkpoints\",\n",
     "        \"save_steps\": 1000,\n",
-    "        \"resume_from_checkpoint\": None,\n",
     "        \"is_train\": True\n",
     "    }\n",
     "    \n",
-    "    # Calculate epochs from training steps\n",
-    "    # This will be calculated after dataloader creation\n",
-    "    \n",
     "    # Set random seeds\n",
     "    torch.manual_seed(args.seed)\n",
     "    np.random.seed(args.seed)\n",
@@ -1305,27 +913,23 @@
     "    if torch.cuda.is_available():\n",
     "        torch.cuda.manual_seed_all(args.seed)\n",
     "    \n",
-    "    # Optimize CUDA settings for memory\n",
     "    torch.backends.cudnn.benchmark = True\n",
-    "    torch.backends.cuda.matmul.allow_tf32 = True  \n",
     "    torch.set_float32_matmul_precision(\"high\")\n",
     "\n",
     "    # Load pretrained models\n",
     "    print(\"Loading pretrained models...\")\n",
     "    models = preload_models_from_standard_weights(args.base_model_path, args.device)\n",
     "    \n",
-    "    # Create dataloaders\n",
-    "    print(\"Creating dataloaders...\")\n",
     "    train_dataloader = create_dataloaders(args)\n",
     "    \n",
-    "    # Calculate epochs from training steps\n",
-    "    steps_per_epoch = len(train_dataloader) // args.gradient_accumulation_steps\n",
-    "    num_epochs = (args.num_training_steps + steps_per_epoch - 1) // steps_per_epoch\n",
-    "    print(f\"Training for {num_epochs} epochs ({args.num_training_steps} steps)\")\n",
-    "    args.num_epochs = num_epochs\n",
-    "    print(f\"Steps per epoch: {steps_per_epoch}\")\n",
-    "    print(f\"Total training steps: {args.num_training_steps}\")\n",
-    "    print(f\"Total epochs: {num_epochs}\")\n",
     "    # Initialize trainer\n",
     "    print(\"Initializing trainer...\")    \n",
     "    trainer = CatVTONTrainer(\n",
@@ -1337,27 +941,28 @@
     "        save_steps=args.save_steps,\n",
     "        output_dir=args.output_dir,\n",
     "        cfg_dropout_prob=args.cfg_dropout_prob,\n",
-    "        guidance_scale=args.guidance_scale,\n",
-    "        num_inference_steps=50,  # Fixed as per paper\n",
-    "        gradient_accumulation_steps=args.gradient_accumulation_steps,\n",
     "        max_grad_norm=args.max_grad_norm,\n",
     "        use_peft=args.use_peft,\n",
     "        dream_lambda=args.dream_lambda,\n",
     "        resume_from_checkpoint=args.resume_from_checkpoint,\n",
-    "        use_mixed_precision=args.use_mixed_precision\n",
     "    )\n",
     "    # Start training\n",
     "    print(\"Starting training...\")\n",
     "    trainer.train() \n",
     "\n",
     "if __name__ == \"__main__\":\n",
-    "    main()\n"
    ]
   },
   {
    "cell_type": "code",
    "execution_count": null,
-   "id": "2eff454d",
    "metadata": {},
    "outputs": [],
    "source": []
@@ -1365,7 +970,7 @@
   {
    "cell_type": "code",
    "execution_count": null,
-   "id": "2eefd6bc",
    "metadata": {},
    "outputs": [],
    "source": []

      "output_type": "stream",
      "text": [
       "Cloning into 'stable-diffusion'...\n",
+      "remote: Enumerating objects: 184, done.\u001b[K\n",
+      "remote: Counting objects: 100% (184/184), done.\u001b[K\n",
+      "remote: Compressing objects: 100% (156/156), done.\u001b[K\n",
+      "remote: Total 184 (delta 44), reused 165 (delta 26), pack-reused 0 (from 0)\u001b[K\n",
+      "Receiving objects: 100% (184/184), 9.94 MiB | 37.02 MiB/s, done.\n",
+      "Resolving deltas: 100% (44/44), done.\n"
      ]
     }
    ],
      "name": "stdout",
      "output_type": "stream",
      "text": [
+      "--2025-06-17 08:50:15--  https://huggingface.co/sd-legacy/stable-diffusion-inpainting/resolve/main/sd-v1-5-inpainting.ckpt\n",
+      "Resolving huggingface.co (huggingface.co)... 3.171.171.104, 3.171.171.128, 3.171.171.6, ...\n",
+      "Connecting to huggingface.co (huggingface.co)|3.171.171.104|:443... connected.\n",
       "HTTP request sent, awaiting response... 307 Temporary Redirect\n",
       "Location: /stable-diffusion-v1-5/stable-diffusion-inpainting/resolve/main/sd-v1-5-inpainting.ckpt [following]\n",
+      "--2025-06-17 08:50:15--  https://huggingface.co/stable-diffusion-v1-5/stable-diffusion-inpainting/resolve/main/sd-v1-5-inpainting.ckpt\n",
       "Reusing existing connection to huggingface.co:443.\n",
       "HTTP request sent, awaiting response... 302 Found\n",
+      "Location: https://cdn-lfs.hf.co/repos/f6/56/f656f0fa3b8a40ac76d297fa2a4b00f981e8eb1261963460764e7dd3b35ec97f/c6bbc15e3224e6973459ba78de4998b80b50112b0ae5b5c67113d56b4e366b19?response-content-disposition=inline%3B+filename*%3DUTF-8%27%27sd-v1-5-inpainting.ckpt%3B+filename%3D%22sd-v1-5-inpainting.ckpt%22%3B&Expires=1750153142&Policy=eyJTdGF0ZW1lbnQiOlt7IkNvbmRpdGlvbiI6eyJEYXRlTGVzc1RoYW4iOnsiQVdTOkVwb2NoVGltZSI6MTc1MDE1MzE0Mn19LCJSZXNvdXJjZSI6Imh0dHBzOi8vY2RuLWxmcy5oZi5jby9yZXBvcy9mNi81Ni9mNjU2ZjBmYTNiOGE0MGFjNzZkMjk3ZmEyYTRiMDBmOTgxZThlYjEyNjE5NjM0NjA3NjRlN2RkM2IzNWVjOTdmL2M2YmJjMTVlMzIyNGU2OTczNDU5YmE3OGRlNDk5OGI4MGI1MDExMmIwYWU1YjVjNjcxMTNkNTZiNGUzNjZiMTk%7EcmVzcG9uc2UtY29udGVudC1kaXNwb3NpdGlvbj0qIn1dfQ__&Signature=kAea10Cu%7EhNLABWiXI0i%7E5gAtwsQUUM6CIZczAEWsswZur-XllSQvXEoKksmPdojVE654r7s-CxII8r%7EQ52to%7EQMLbjsjw-JmXq4duiq91qz6U5aenByAXSpOO1ihAoCmCkP02e7L5Wcbs%7EhaV26W9Q%7EAfbwyQ1mn9ta%7EHIDiE7AuNuHgkEEA2IP45ao25b9zsaFw6fIUlBy93Meuf82zwzsw8CJPWV9QEwj-oPVeSDyv3ZhfxS3iCgGSYS320Vs7NcK%7EqJxPfttpTHG9m6zAnfxOpWjYVQfre6HnHUt3VHOy4QdDvpyfljgEQoH4LxRBWI%7Ev72YjOJZDEgSPoTi1Q__&Key-Pair-Id=K3RPWS32NSSJCE [following]\n",
+      "--2025-06-17 08:50:15--  https://cdn-lfs.hf.co/repos/f6/56/f656f0fa3b8a40ac76d297fa2a4b00f981e8eb1261963460764e7dd3b35ec97f/c6bbc15e3224e6973459ba78de4998b80b50112b0ae5b5c67113d56b4e366b19?response-content-disposition=inline%3B+filename*%3DUTF-8%27%27sd-v1-5-inpainting.ckpt%3B+filename%3D%22sd-v1-5-inpainting.ckpt%22%3B&Expires=1750153142&Policy=eyJTdGF0ZW1lbnQiOlt7IkNvbmRpdGlvbiI6eyJEYXRlTGVzc1RoYW4iOnsiQVdTOkVwb2NoVGltZSI6MTc1MDE1MzE0Mn19LCJSZXNvdXJjZSI6Imh0dHBzOi8vY2RuLWxmcy5oZi5jby9yZXBvcy9mNi81Ni9mNjU2ZjBmYTNiOGE0MGFjNzZkMjk3ZmEyYTRiMDBmOTgxZThlYjEyNjE5NjM0NjA3NjRlN2RkM2IzNWVjOTdmL2M2YmJjMTVlMzIyNGU2OTczNDU5YmE3OGRlNDk5OGI4MGI1MDExMmIwYWU1YjVjNjcxMTNkNTZiNGUzNjZiMTk%7EcmVzcG9uc2UtY29udGVudC1kaXNwb3NpdGlvbj0qIn1dfQ__&Signature=kAea10Cu%7EhNLABWiXI0i%7E5gAtwsQUUM6CIZczAEWsswZur-XllSQvXEoKksmPdojVE654r7s-CxII8r%7EQ52to%7EQMLbjsjw-JmXq4duiq91qz6U5aenByAXSpOO1ihAoCmCkP02e7L5Wcbs%7EhaV26W9Q%7EAfbwyQ1mn9ta%7EHIDiE7AuNuHgkEEA2IP45ao25b9zsaFw6fIUlBy93Meuf82zwzsw8CJPWV9QEwj-oPVeSDyv3ZhfxS3iCgGSYS320Vs7NcK%7EqJxPfttpTHG9m6zAnfxOpWjYVQfre6HnHUt3VHOy4QdDvpyfljgEQoH4LxRBWI%7Ev72YjOJZDEgSPoTi1Q__&Key-Pair-Id=K3RPWS32NSSJCE\n",
+      "Resolving cdn-lfs.hf.co (cdn-lfs.hf.co)... 18.160.78.83, 18.160.78.87, 18.160.78.43, ...\n",
+      "Connecting to cdn-lfs.hf.co (cdn-lfs.hf.co)|18.160.78.83|:443... connected.\n",
       "HTTP request sent, awaiting response... 200 OK\n",
       "Length: 4265437280 (4.0G) [binary/octet-stream]\n",
       "Saving to: ‘sd-v1-5-inpainting.ckpt’\n",
       "\n",
+      "sd-v1-5-inpainting. 100%[===================>]   3.97G   324MB/s    in 12s     \n",
       "\n",
+      "2025-06-17 08:50:27 (341 MB/s) - ‘sd-v1-5-inpainting.ckpt’ saved [4265437280/4265437280]\n",
       "\n"
      ]
     }
   },
   {
    "cell_type": "code",
+   "execution_count": 5,
    "id": "4c5198ca",
    "metadata": {},
    "outputs": [
      "name": "stdout",
      "output_type": "stream",
      "text": [
+      "attention.py  interface.py\t  README.md\t\t   utils.py\n",
+      "clip.py       load_model.py\t  requirements.txt\t   VITON_Dataset.py\n",
+      "ddpm.py       merges.txt\t  sample_dataset\t   vocab.json\n",
+      "decoder.py    model_converter.py  sd-v1-5-inpainting.ckpt\n",
+      "diffusion.py  output\t\t  test.ipynb\n",
+      "encoder.py    pipeline.py\t  training.ipynb\n"
      ]
     }
    ],
     "# !pip install -U --no-cache-dir gdown --pre"
    ]
   },
   {
    "cell_type": "code",
    "execution_count": null,
   },
   {
    "cell_type": "code",
+   "execution_count": 6,
    "id": "53095103",
    "metadata": {},
    "outputs": [
     {
      "name": "stdout",
      "output_type": "stream",
      "text": [
+      "mkdir: cannot create directory ‘output’: File exists\n"
      ]
     }
    ],
    "source": [
+    "!mkdir output\n",
+    "!mkdir checkpoints"
    ]
   },
   {
    "cell_type": "code",
+   "execution_count": 34,
    "id": "7efe325c",
    "metadata": {},
    "outputs": [],
   },
   {
    "cell_type": "code",
+   "execution_count": 35,
    "id": "a48f2753",
    "metadata": {},
    "outputs": [
      "traceback": [
       "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m",
       "\u001b[0;31mKeyError\u001b[0m                                  Traceback (most recent call last)",
+      "\u001b[0;32m/tmp/ipykernel_69/1017109895.py\u001b[0m in \u001b[0;36m<cell line: 0>\u001b[0;34m()\u001b[0m\n\u001b[1;32m      3\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m      4\u001b[0m \u001b[0mtorch\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mcuda\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mempty_cache\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m  \u001b[0;31m# Release unused GPU memory\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m----> 5\u001b[0;31m \u001b[0mgc\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mcollect\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m              \u001b[0;31m# Run Python garbage collector\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m",
       "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/IPython/core/displayhook.py\u001b[0m in \u001b[0;36m__call__\u001b[0;34m(self, result)\u001b[0m\n\u001b[1;32m    261\u001b[0m             \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mwrite_output_prompt\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    262\u001b[0m             \u001b[0mformat_dict\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mmd_dict\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mcompute_format_data\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mresult\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 263\u001b[0;31m             \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mupdate_user_ns\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mresult\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m    264\u001b[0m             \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mfill_exec_result\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mresult\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    265\u001b[0m             \u001b[0;32mif\u001b[0m \u001b[0mformat_dict\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
       "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/IPython/core/displayhook.py\u001b[0m in \u001b[0;36mupdate_user_ns\u001b[0;34m(self, result)\u001b[0m\n\u001b[1;32m    199\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    200\u001b[0m         \u001b[0;31m# Avoid recursive reference when displaying _oh/Out\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 201\u001b[0;31m         \u001b[0;32mif\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mcache_size\u001b[0m \u001b[0;32mand\u001b[0m \u001b[0mresult\u001b[0m \u001b[0;32mis\u001b[0m \u001b[0;32mnot\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mshell\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0muser_ns\u001b[0m\u001b[0;34m[\u001b[0m\u001b[0;34m'_oh'\u001b[0m\u001b[0;34m]\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m    202\u001b[0m             \u001b[0;32mif\u001b[0m \u001b[0mlen\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mshell\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0muser_ns\u001b[0m\u001b[0;34m[\u001b[0m\u001b[0;34m'_oh'\u001b[0m\u001b[0;34m]\u001b[0m\u001b[0;34m)\u001b[0m \u001b[0;34m>=\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mcache_size\u001b[0m \u001b[0;32mand\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mdo_full_cache\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    203\u001b[0m                 \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mcull_cache\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
       "\u001b[0;31mKeyError\u001b[0m: '_oh'"
   },
   {
    "cell_type": "code",
+   "execution_count": 36,
    "id": "5a57d765",
    "metadata": {},
    "outputs": [],
   },
   {
    "cell_type": "code",
+   "execution_count": 37,
    "id": "5957ec57",
    "metadata": {},
+   "outputs": [],
    "source": [
     "import tensorflow as tf\n",
     "tf.keras.backend.clear_session()"
   },
   {
    "cell_type": "code",
+   "execution_count": 38,
    "id": "796e8ef7",
    "metadata": {},
    "outputs": [
   },
   {
    "cell_type": "code",
+   "execution_count": null,
    "id": "32ed173e",
    "metadata": {},
    "outputs": [
      "output_type": "stream",
      "text": [
       "Total RAM: 31.35 GB\n",
+      "Available RAM: 24.16 GB\n"
      ]
     }
    ],
   },
   {
    "cell_type": "code",
+   "execution_count": 39,
    "id": "3ce888b6",
    "metadata": {},
    "outputs": [],
     "        (image_tensor.shape[0], 4, image_tensor.shape[2] // 8, image_tensor.shape[3] // 8),\n",
     "        device=device,\n",
     "    )\n",
+    "    with torch.no_grad():  # VAE encoding doesn't need gradients\n",
+    "        return encoder(image_tensor, encoder_noise)"
    ]
   },
   {
    "cell_type": "code",
+   "execution_count": 41,
+   "id": "3aea80d9",
    "metadata": {},
    "outputs": [
     {
      ]
     },
     {
+     "ename": "OutOfMemoryError",
+     "evalue": "CUDA out of memory. Tried to allocate 58.00 MiB. GPU 0 has a total capacity of 15.89 GiB of which 29.12 MiB is free. Process 3907 has 15.85 GiB memory in use. Of the allocated memory 15.49 GiB is allocated by PyTorch, and 62.82 MiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation.  See documentation for Memory Management  (https://pytorch.org/docs/stable/notes/cuda.html#environment-variables)",
      "output_type": "error",
      "traceback": [
       "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m",
+      "\u001b[0;31mOutOfMemoryError\u001b[0m                          Traceback (most recent call last)",
+      "\u001b[0;32m/tmp/ipykernel_69/1468414648.py\u001b[0m in \u001b[0;36m<cell line: 0>\u001b[0;34m()\u001b[0m\n\u001b[1;32m    502\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    503\u001b[0m \u001b[0;32mif\u001b[0m \u001b[0m__name__\u001b[0m \u001b[0;34m==\u001b[0m \u001b[0;34m\"__main__\"\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 504\u001b[0;31m     \u001b[0mmain\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m",
+      "\u001b[0;32m/tmp/ipykernel_69/1468414648.py\u001b[0m in \u001b[0;36mmain\u001b[0;34m()\u001b[0m\n\u001b[1;32m    467\u001b[0m     \u001b[0;31m# Load pretrained models\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    468\u001b[0m     \u001b[0mprint\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m\"Loading pretrained models...\"\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 469\u001b[0;31m     \u001b[0mmodels\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mpreload_models_from_standard_weights\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0margs\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mbase_model_path\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0margs\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mdevice\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m    470\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    471\u001b[0m     \u001b[0;31m# Create dataloader\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
+      "\u001b[0;32m/kaggle/working/stable-diffusion/load_model.py\u001b[0m in \u001b[0;36mpreload_models_from_standard_weights\u001b[0;34m(ckpt_path, device, finetune_weights_path)\u001b[0m\n\u001b[1;32m     14\u001b[0m     \u001b[0mstate_dict\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0mmodel_converter\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mload_from_standard_weights\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mckpt_path\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mdevice\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m     15\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m---> 16\u001b[0;31m     \u001b[0mdiffusion\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0mDiffusion\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0min_channels\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0min_channels\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mout_channels\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0mout_channels\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mto\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mdevice\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m     17\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m     18\u001b[0m     \u001b[0;32mif\u001b[0m \u001b[0mfinetune_weights_path\u001b[0m \u001b[0;34m!=\u001b[0m \u001b[0;32mNone\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
+      "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py\u001b[0m in \u001b[0;36mto\u001b[0;34m(self, *args, **kwargs)\u001b[0m\n\u001b[1;32m   1338\u001b[0m                     \u001b[0;32mraise\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1339\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m-> 1340\u001b[0;31m         \u001b[0;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_apply\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mconvert\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m   1341\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1342\u001b[0m     def register_full_backward_pre_hook(\n",
+      "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py\u001b[0m in \u001b[0;36m_apply\u001b[0;34m(self, fn, recurse)\u001b[0m\n\u001b[1;32m    898\u001b[0m         \u001b[0;32mif\u001b[0m \u001b[0mrecurse\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    899\u001b[0m             \u001b[0;32mfor\u001b[0m \u001b[0mmodule\u001b[0m \u001b[0;32min\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mchildren\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 900\u001b[0;31m                 \u001b[0mmodule\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_apply\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mfn\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m    901\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    902\u001b[0m         \u001b[0;32mdef\u001b[0m \u001b[0mcompute_should_use_set_data\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mtensor\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mtensor_applied\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
+      "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py\u001b[0m in \u001b[0;36m_apply\u001b[0;34m(self, fn, recurse)\u001b[0m\n\u001b[1;32m    898\u001b[0m         \u001b[0;32mif\u001b[0m \u001b[0mrecurse\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    899\u001b[0m             \u001b[0;32mfor\u001b[0m \u001b[0mmodule\u001b[0m \u001b[0;32min\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mchildren\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 900\u001b[0;31m                 \u001b[0mmodule\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_apply\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mfn\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m    901\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    902\u001b[0m         \u001b[0;32mdef\u001b[0m \u001b[0mcompute_should_use_set_data\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mtensor\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mtensor_applied\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
+      "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py\u001b[0m in \u001b[0;36m_apply\u001b[0;34m(self, fn, recurse)\u001b[0m\n\u001b[1;32m    898\u001b[0m         \u001b[0;32mif\u001b[0m \u001b[0mrecurse\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    899\u001b[0m             \u001b[0;32mfor\u001b[0m \u001b[0mmodule\u001b[0m \u001b[0;32min\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mchildren\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 900\u001b[0;31m                 \u001b[0mmodule\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_apply\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mfn\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m    901\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    902\u001b[0m         \u001b[0;32mdef\u001b[0m \u001b[0mcompute_should_use_set_data\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mtensor\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mtensor_applied\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
+      "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py\u001b[0m in \u001b[0;36m_apply\u001b[0;34m(self, fn, recurse)\u001b[0m\n\u001b[1;32m    898\u001b[0m         \u001b[0;32mif\u001b[0m \u001b[0mrecurse\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    899\u001b[0m             \u001b[0;32mfor\u001b[0m \u001b[0mmodule\u001b[0m \u001b[0;32min\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mchildren\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 900\u001b[0;31m                 \u001b[0mmodule\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_apply\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mfn\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m    901\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    902\u001b[0m         \u001b[0;32mdef\u001b[0m \u001b[0mcompute_should_use_set_data\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mtensor\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mtensor_applied\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
+      "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py\u001b[0m in \u001b[0;36m_apply\u001b[0;34m(self, fn, recurse)\u001b[0m\n\u001b[1;32m    898\u001b[0m         \u001b[0;32mif\u001b[0m \u001b[0mrecurse\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    899\u001b[0m             \u001b[0;32mfor\u001b[0m \u001b[0mmodule\u001b[0m \u001b[0;32min\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mchildren\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 900\u001b[0;31m                 \u001b[0mmodule\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_apply\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mfn\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m    901\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    902\u001b[0m         \u001b[0;32mdef\u001b[0m \u001b[0mcompute_should_use_set_data\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mtensor\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mtensor_applied\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
+      "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py\u001b[0m in \u001b[0;36m_apply\u001b[0;34m(self, fn, recurse)\u001b[0m\n\u001b[1;32m    925\u001b[0m             \u001b[0;31m# `with torch.no_grad():`\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    926\u001b[0m             \u001b[0;32mwith\u001b[0m \u001b[0mtorch\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mno_grad\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 927\u001b[0;31m                 \u001b[0mparam_applied\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mfn\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mparam\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m    928\u001b[0m             \u001b[0mp_should_use_set_data\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mcompute_should_use_set_data\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mparam\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mparam_applied\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m    929\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n",
+      "\u001b[0;32m/usr/local/lib/python3.11/dist-packages/torch/nn/modules/module.py\u001b[0m in \u001b[0;36mconvert\u001b[0;34m(t)\u001b[0m\n\u001b[1;32m   1324\u001b[0m                         \u001b[0mmemory_format\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0mconvert_to_format\u001b[0m\u001b[0;34m,\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1325\u001b[0m                     )\n\u001b[0;32m-> 1326\u001b[0;31m                 return t.to(\n\u001b[0m\u001b[1;32m   1327\u001b[0m                     \u001b[0mdevice\u001b[0m\u001b[0;34m,\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m   1328\u001b[0m                     \u001b[0mdtype\u001b[0m \u001b[0;32mif\u001b[0m \u001b[0mt\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mis_floating_point\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m \u001b[0;32mor\u001b[0m \u001b[0mt\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mis_complex\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m \u001b[0;32melse\u001b[0m \u001b[0;32mNone\u001b[0m\u001b[0;34m,\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
+      "\u001b[0;31mOutOfMemoryError\u001b[0m: CUDA out of memory. Tried to allocate 58.00 MiB. GPU 0 has a total capacity of 15.89 GiB of which 29.12 MiB is free. Process 3907 has 15.85 GiB memory in use. Of the allocated memory 15.49 GiB is allocated by PyTorch, and 62.82 MiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation.  See documentation for Memory Management  (https://pytorch.org/docs/stable/notes/cuda.html#environment-variables)"
      ]
     }
    ],
     "\n",
     "# Import your custom modules\n",
     "from load_model import preload_models_from_standard_weights\n",
+    "from ddpm import DDPMSampler\n",
     "from utils import check_inputs, get_time_embedding, prepare_image, prepare_mask_image\n",
     "from diffusers.utils.torch_utils import randn_tensor\n",
     "\n",
     "class CatVTONTrainer:\n",
+    "    \"\"\"Simplified CatVTON Training Class with PEFT, CFG and DREAM support\"\"\"\n",
     "    \n",
     "    def __init__(\n",
     "        self,\n",
     "        train_dataloader: DataLoader,\n",
     "        val_dataloader: Optional[DataLoader] = None,\n",
     "        device: str = \"cuda\",\n",
+    "        learning_rate: float = 1e-5,\n",
+    "        num_epochs: int = 50,\n",
     "        save_steps: int = 1000,\n",
     "        output_dir: str = \"./checkpoints\",\n",
     "        cfg_dropout_prob: float = 0.1,\n",
     "        max_grad_norm: float = 1.0,\n",
     "        use_peft: bool = True,\n",
+    "        dream_lambda: float = 10.0,\n",
     "        resume_from_checkpoint: Optional[str] = None,\n",
+    "        use_mixed_precision: bool = True,\n",
     "        height=512,\n",
     "        width=384,\n",
     "    ):\n",
     "        self.save_steps = save_steps\n",
     "        self.output_dir = Path(output_dir)\n",
     "        self.cfg_dropout_prob = cfg_dropout_prob\n",
     "        self.max_grad_norm = max_grad_norm\n",
     "        self.use_peft = use_peft\n",
     "        self.dream_lambda = dream_lambda\n",
     "        self.use_mixed_precision = use_mixed_precision\n",
+    "        self.height = height\n",
+    "        self.width = width\n",
     "        self.generator = torch.Generator(device=device)\n",
     "        \n",
     "        # Create output directory\n",
     "        if resume_from_checkpoint:\n",
     "            self._load_checkpoint(resume_from_checkpoint)\n",
     "    \n",
+    "        self.encoder = self.models.get('encoder', None)\n",
+    "        self.decoder = self.models.get('decoder', None)\n",
+    "        self.diffusion = self.models.get('diffusion', None)\n",
     "\n",
     "        # Setup models and optimizers\n",
     "        self._setup_training()\n",
     "    \n",
     "    def _setup_training(self):\n",
     "        \"\"\"Setup models for training with PEFT\"\"\"\n",
+    "        # Move models to device\n",
     "        for name, model in self.models.items():\n",
     "            model.to(self.device)\n",
     "        \n",
     "        # Freeze all parameters first\n",
     "        for model in self.models.values():\n",
     "            self._enable_peft_training()\n",
     "        else:\n",
     "            # Enable full training for diffusion model\n",
+    "            for param in self.diffusion.parameters():\n",
     "                param.requires_grad = True\n",
     "        \n",
     "        # Collect trainable parameters\n",
     "        print(f\"Total parameters: {total_params:,}\")\n",
     "        print(f\"Trainable parameters: {trainable_count:,} ({trainable_count/total_params*100:.2f}%)\")\n",
     "        \n",
     "        # Setup optimizer - AdamW as per paper\n",
     "        self.optimizer = AdamW(\n",
     "            trainable_params,\n",
     "            eps=1e-8\n",
     "        )\n",
     "        \n",
+    "        # Setup learning rate scheduler (constant)\n",
     "        self.lr_scheduler = torch.optim.lr_scheduler.LambdaLR(\n",
     "            self.optimizer, lr_lambda=lambda epoch: 1.0\n",
     "        )\n",
     "    \n",
     "    def _enable_peft_training(self):\n",
+    "        \"\"\"Enable PEFT training - only self-attention layers\"\"\"\n",
     "        print(\"Enabling PEFT training (self-attention layers only)\")\n",
     "        \n",
     "        unet = self.diffusion.unet\n",
     "        \n",
+    "        # Enable attention layers in encoders and decoders\n",
     "        for layers in [unet.encoders, unet.decoders]:\n",
     "            for layer in layers:\n",
+    "                for module_idx, module in enumerate(layer):\n",
+    "                    for name, param in module.named_parameters():\n",
+    "                        if 'attention_1' in name:\n",
+    "                            param.requires_grad = True\n",
+    "                        \n",
     "        # Enable attention layers in bottleneck\n",
     "        for layer in unet.bottleneck:\n",
+    "            for name, param in layer.named_parameters():\n",
+    "                if 'attention_1' in name:\n",
     "                    param.requires_grad = True\n",
+    "                    \n",
     "    def _apply_cfg_dropout(self, garment_latent: torch.Tensor) -> torch.Tensor:\n",
     "        \"\"\"Apply classifier-free guidance dropout (10% chance)\"\"\"\n",
     "        if self.training and random.random() < self.cfg_dropout_prob:\n",
     "        cloth_images = batch['cloth'].to(self.device)\n",
     "        masks = batch['mask'].to(self.device)\n",
     "\n",
+    "        concat_dim = -2  # y axis concat\n",
+    "        \n",
+    "        # Prepare inputs\n",
     "        image, condition_image, mask = check_inputs(person_images, cloth_images, masks, self.width, self.height)\n",
     "        image = prepare_image(person_images).to(self.device, dtype=self.weight_dtype)\n",
     "        condition_image = prepare_image(cloth_images).to(self.device, dtype=self.weight_dtype)\n",
     "        mask = prepare_mask_image(masks).to(self.device, dtype=self.weight_dtype)\n",
+    "        \n",
     "        # Mask image\n",
     "        masked_image = image * (mask < 0.5)\n",
     "\n",
     "        with torch.cuda.amp.autocast(enabled=self.use_mixed_precision):\n",
+    "            # VAE encoding\n",
     "            masked_latent = compute_vae_encodings(masked_image, self.encoder)\n",
     "            person_latent = compute_vae_encodings(person_images, self.encoder)\n",
     "            condition_latent = compute_vae_encodings(condition_image, self.encoder)\n",
     "            mask_latent = torch.nn.functional.interpolate(mask, size=masked_latent.shape[-2:], mode=\"nearest\")\n",
+    "            \n",
     "            del image, mask, condition_image\n",
     "\n",
     "            # Apply CFG dropout to garment latent\n",
     "            condition_latent = self._apply_cfg_dropout(condition_latent)\n",
     "            \n",
     "            # Concatenate latents\n",
     "            masked_latent_concat = torch.cat([masked_latent, condition_latent], dim=concat_dim)\n",
     "            mask_latent_concat = torch.cat([mask_latent, torch.zeros_like(mask_latent)], dim=concat_dim)\n",
+    "            target_latents = torch.cat([person_latent, condition_latent], dim=concat_dim)\n",
     "\n",
+    "            noise = randn_tensor(\n",
     "                masked_latent_concat.shape,\n",
     "                generator=self.generator,\n",
     "                device=masked_latent_concat.device,\n",
     "                # Get initial noise prediction\n",
     "                with torch.no_grad():\n",
     "                    epsilon_theta = self.diffusion(\n",
+    "                        inpainting_latent_model_input,\n",
+    "                        timesteps_embedding\n",
+    "                    )\n",
     "                \n",
     "                # Apply DREAM: zˆt = √αt*z0 + √(1-αt)*(ε + λ*εθ)\n",
     "                alphas_cumprod = self.scheduler.alphas_cumprod.to(device=self.device, dtype=self.weight_dtype)\n",
     "                    masked_latent_concat\n",
     "                ], dim=1)\n",
     "\n",
+    "                predicted_noise = self.diffusion(\n",
     "                    dream_model_input,\n",
     "                    timesteps_embedding\n",
     "                )\n",
     "        return loss\n",
     "    \n",
     "    def train_epoch(self) -> float:\n",
+    "        \"\"\"Train for one epoch - simplified version\"\"\"\n",
+    "        self.diffusion.train()\n",
     "        total_loss = 0.0\n",
     "        num_batches = len(self.train_dataloader)\n",
     "        \n",
     "        progress_bar = tqdm(self.train_dataloader, desc=f\"Epoch {self.current_epoch+1}\")\n",
     "        \n",
     "        for step, batch in enumerate(progress_bar):\n",
+    "            # Zero gradients\n",
+    "            self.optimizer.zero_grad()\n",
+    "            \n",
+    "            # Forward pass with mixed precision\n",
     "            if self.use_mixed_precision:\n",
     "                with torch.cuda.amp.autocast():\n",
     "                    loss = self.compute_loss(batch)\n",
     "                \n",
     "                # Backward pass with scaling\n",
     "                self.scaler.scale(loss).backward()\n",
+    "                \n",
+    "                # Gradient clipping and optimizer step\n",
+    "                self.scaler.unscale_(self.optimizer)\n",
+    "                torch.nn.utils.clip_grad_norm_(\n",
+    "                    [p for p in self.diffusion.parameters() if p.requires_grad],\n",
+    "                    self.max_grad_norm\n",
+    "                )\n",
+    "                \n",
+    "                self.scaler.step(self.optimizer)\n",
+    "                self.scaler.update()\n",
     "            else:\n",
     "                loss = self.compute_loss(batch)\n",
     "                loss.backward()\n",
     "                \n",
+    "                # Gradient clipping\n",
+    "                torch.nn.utils.clip_grad_norm_(\n",
+    "                    [p for p in self.diffusion.parameters() if p.requires_grad],\n",
+    "                    self.max_grad_norm\n",
+    "                )\n",
+    "                \n",
+    "                # Optimizer step\n",
+    "                self.optimizer.step()\n",
+    "            \n",
+    "            # Update learning rate\n",
+    "            self.lr_scheduler.step()\n",
+    "            self.global_step += 1\n",
     "            \n",
+    "            total_loss += loss.item()\n",
     "            \n",
     "            # Update progress bar\n",
     "            progress_bar.set_postfix({\n",
+    "                'loss': loss.item(),\n",
     "                'lr': self.optimizer.param_groups[0]['lr'],\n",
     "                'step': self.global_step\n",
     "            })\n",
     "            \n",
+    "            # Save checkpoint based on steps\n",
     "            if self.global_step % self.save_steps == 0:\n",
     "                self._save_checkpoint()\n",
     "            \n",
     "        return total_loss / num_batches\n",
     "    \n",
     "    def train(self):\n",
+    "        \"\"\"Main training loop - simplified version\"\"\"\n",
     "        print(f\"Starting training for {self.num_epochs} epochs\")\n",
+    "        print(f\"Total training batches per epoch: {len(self.train_dataloader)}\")\n",
     "        print(f\"Using DREAM with lambda = {self.dream_lambda}\")\n",
     "        print(f\"Mixed precision: {self.use_mixed_precision}\")\n",
     "        \n",
     "        for epoch in range(self.current_epoch, self.num_epochs):\n",
     "            self.current_epoch = epoch\n",
     "            \n",
+    "            # Train one epoch\n",
     "            train_loss = self.train_epoch()\n",
     "            \n",
+    "            print(f\"Epoch {epoch+1}/{self.num_epochs} - Train Loss: {train_loss:.6f}\")\n",
     "            \n",
     "            # Save epoch checkpoint\n",
+    "            if (epoch + 1) % 5 == 0:  # Save every 5 epochs\n",
     "                self._save_checkpoint(epoch_checkpoint=True)\n",
     "            \n",
     "            # Clear cache at end of epoch\n",
     "            torch.cuda.empty_cache()\n",
+    "        \n",
+    "        # Save final checkpoint\n",
+    "        self._save_checkpoint(is_final=True)\n",
+    "        print(\"Training completed!\")\n",
     "    \n",
+    "    def _save_checkpoint(self, is_best: bool = False, epoch_checkpoint: bool = False, is_final: bool = False):\n",
     "        \"\"\"Save model checkpoint\"\"\"\n",
     "        checkpoint = {\n",
     "            'global_step': self.global_step,\n",
     "        if self.use_mixed_precision:\n",
     "            checkpoint['scaler_state_dict'] = self.scaler.state_dict()\n",
     "        \n",
+    "        if is_final:\n",
+    "            checkpoint_path = self.output_dir / \"final_model.pth\"\n",
+    "        elif is_best:\n",
     "            checkpoint_path = self.output_dir / \"best_model.pth\"\n",
     "        elif epoch_checkpoint:\n",
     "            checkpoint_path = self.output_dir / f\"checkpoint_epoch_{self.current_epoch+1}.pth\"\n",
     "        print(f\"Checkpoint loaded: {checkpoint_path}\")\n",
     "        print(f\"Resuming from epoch {self.current_epoch}, step {self.global_step}\")\n",
     "\n",
+    "\n",
+    "def create_dataloaders(args) -> DataLoader:\n",
+    "    \"\"\"Create training dataloader\"\"\"\n",
     "    if args.dataset_name == \"vitonhd\":\n",
     "        dataset = VITONHDTestDataset(args)\n",
     "    else:\n",
+    "        raise ValueError(f\"Invalid dataset name {args.dataset_name}.\")\n",
+    "    \n",
     "    print(f\"Dataset {args.dataset_name} loaded, total {len(dataset)} pairs.\")\n",
+    "    \n",
     "    dataloader = DataLoader(\n",
     "        dataset,\n",
     "        batch_size=args.batch_size,\n",
+    "        shuffle=True,\n",
+    "        num_workers=8,\n",
+    "        pin_memory=True,\n",
+    "        persistent_workers=True,\n",
+    "        prefetch_factor=2\n",
     "    )\n",
     "    \n",
     "    return dataloader\n",
     "\n",
     "\n",
     "def main():\n",
+    "    args = argparse.Namespace()\n",
+    "    args.__dict__ = {\n",
     "        \"base_model_path\": \"sd-v1-5-inpainting.ckpt\",\n",
     "        \"dataset_name\": \"vitonhd\",\n",
     "        \"data_root_path\": \"/kaggle/input/viton-hd-dataset\",\n",
+    "        \"output_dir\": \"./checkpoints\",\n",
+    "        \"resume_from_checkpoint\": None,\n",
     "        \"seed\": 42,\n",
     "        \"batch_size\": 1,\n",
     "        \"width\": 384,\n",
     "        \"height\": 512,\n",
     "        \"repaint\": True,\n",
     "        \"eval_pair\": True,\n",
     "        \"concat_eval_results\": True,\n",
     "        \"concat_axis\": 'y',\n",
+    "        \"device\": \"cuda\",\n",
+    "        \"num_epochs\": 50,  \n",
     "        \"learning_rate\": 1e-5,\n",
     "        \"max_grad_norm\": 1.0,\n",
     "        \"cfg_dropout_prob\": 0.1,\n",
     "        \"dream_lambda\": 0,\n",
+    "        \"use_peft\": True,\n",
     "        \"use_mixed_precision\": True,\n",
     "        \"save_steps\": 1000,\n",
     "        \"is_train\": True\n",
     "    }\n",
     "    \n",
     "    # Set random seeds\n",
     "    torch.manual_seed(args.seed)\n",
     "    np.random.seed(args.seed)\n",
     "    if torch.cuda.is_available():\n",
     "        torch.cuda.manual_seed_all(args.seed)\n",
     "    \n",
+    "    # Optimize CUDA settings\n",
     "    torch.backends.cudnn.benchmark = True\n",
+    "    torch.backends.cuda.matmul.allow_tf32 = True \n",
+    "    torch.backends.cudnn.allow_tf32 = True \n",
     "    torch.set_float32_matmul_precision(\"high\")\n",
     "\n",
     "    # Load pretrained models\n",
     "    print(\"Loading pretrained models...\")\n",
     "    models = preload_models_from_standard_weights(args.base_model_path, args.device)\n",
     "    \n",
+    "    # Create dataloader\n",
+    "    print(\"Creating dataloader...\")\n",
     "    train_dataloader = create_dataloaders(args)\n",
     "    \n",
+    "    print(f\"Training for {args.num_epochs} epochs\")\n",
+    "    print(f\"Batches per epoch: {len(train_dataloader)}\")\n",
+    "    \n",
     "    # Initialize trainer\n",
     "    print(\"Initializing trainer...\")    \n",
     "    trainer = CatVTONTrainer(\n",
     "        save_steps=args.save_steps,\n",
     "        output_dir=args.output_dir,\n",
     "        cfg_dropout_prob=args.cfg_dropout_prob,\n",
     "        max_grad_norm=args.max_grad_norm,\n",
     "        use_peft=args.use_peft,\n",
     "        dream_lambda=args.dream_lambda,\n",
     "        resume_from_checkpoint=args.resume_from_checkpoint,\n",
+    "        use_mixed_precision=args.use_mixed_precision,\n",
+    "        height=args.height,\n",
+    "        width=args.width\n",
     "    )\n",
+    "    \n",
     "    # Start training\n",
     "    print(\"Starting training...\")\n",
     "    trainer.train() \n",
     "\n",
+    "\n",
     "if __name__ == \"__main__\":\n",
+    "    main()"
    ]
   },
   {
    "cell_type": "code",
    "execution_count": null,
+   "id": "77892d6a",
    "metadata": {},
    "outputs": [],
    "source": []
   {
    "cell_type": "code",
    "execution_count": null,
+   "id": "b3917d76",
    "metadata": {},
    "outputs": [],
    "source": []