vjt
/

T5Training

+---
+license: apache-2.0
+tags:
+- generated_from_trainer
+datasets:
+- wikisql
+model-index:
+- name: T5Training
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# T5Training
+This model is a fine-tuned version of [t5-base](https://huggingface.co/t5-base) on the wikisql dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.0341
+- Rouge2 Precision: 0.9368
+- Rouge2 Recall: 0.8687
+- Rouge2 Fmeasure: 0.896
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 5e-05
+- train_batch_size: 16
+- eval_batch_size: 16
+- seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- num_epochs: 5
+### Training results
+| Training Loss | Epoch | Step  | Validation Loss | Rouge2 Precision | Rouge2 Recall | Rouge2 Fmeasure |
+|:-------------:|:-----:|:-----:|:---------------:|:----------------:|:-------------:|:---------------:|
+| 0.0225        | 1.0   | 4049  | 0.0355          | 0.9325           | 0.8665        | 0.8929          |
+| 0.0182        | 2.0   | 8098  | 0.0359          | 0.9364           | 0.8682        | 0.8956          |
+| 0.016         | 3.0   | 12147 | 0.0354          | 0.9353           | 0.868         | 0.895           |
+| 0.0156        | 4.0   | 16196 | 0.0351          | 0.9366           | 0.8684        | 0.8958          |
+| 0.0177        | 5.0   | 20245 | 0.0341          | 0.9368           | 0.8687        | 0.896           |
+### Framework versions
+- Transformers 4.26.0
+- Pytorch 1.13.1+cu117
+- Datasets 2.8.0
+- Tokenizers 0.13.2

T5Train.ipynb CHANGED Viewed

@@ -199,7 +199,7 @@
   {
    "cell_type": "code",
    "execution_count": null,
-   "id": "b0a1835b",
    "metadata": {},
    "outputs": [],
    "source": []
@@ -7534,8 +7534,8 @@
        "\n",
        "    <div>\n",
        "      \n",
-       "      <progress value='20246' max='20245' style='width:300px; height:20px; vertical-align: middle;'></progress>\n",
-       "      [20245/20245 4:07:47, Epoch 5/5]\n",
        "    </div>\n",
        "    <table border=\"1\" class=\"dataframe\">\n",
        "  <thead>\n",
@@ -7581,14 +7581,16 @@
        "      <td>0.868400</td>\n",
        "      <td>0.895800</td>\n",
        "    </tr>\n",
        "  </tbody>\n",
-       "</table><p>\n",
-       "    <div>\n",
-       "      \n",
-       "      <progress value='946' max='993' style='width:300px; height:20px; vertical-align: middle;'></progress>\n",
-       "      [946/993 09:10 < 00:27, 1.72 it/s]\n",
-       "    </div>\n",
-       "    "
       ],
       "text/plain": [
        "<IPython.core.display.HTML object>"
@@ -42584,8 +42586,361 @@
       "  \"pad_token_id\": 0,\n",
       "  \"transformers_version\": \"4.26.0\"\n",
       "}\n",
       "\n"
      ]
     }
    ],
    "source": [

   {
    "cell_type": "code",
    "execution_count": null,
+   "id": "76f3fc6f",
    "metadata": {},
    "outputs": [],
    "source": []
        "\n",
        "    <div>\n",
        "      \n",
+       "      <progress value='20245' max='20245' style='width:300px; height:20px; vertical-align: middle;'></progress>\n",
+       "      [20245/20245 4:18:19, Epoch 5/5]\n",
        "    </div>\n",
        "    <table border=\"1\" class=\"dataframe\">\n",
        "  <thead>\n",
        "      <td>0.868400</td>\n",
        "      <td>0.895800</td>\n",
        "    </tr>\n",
+       "    <tr>\n",
+       "      <td>5</td>\n",
+       "      <td>0.017700</td>\n",
+       "      <td>0.034084</td>\n",
+       "      <td>0.936800</td>\n",
+       "      <td>0.868700</td>\n",
+       "      <td>0.896000</td>\n",
+       "    </tr>\n",
        "  </tbody>\n",
+       "</table><p>"
       ],
       "text/plain": [
        "<IPython.core.display.HTML object>"
       "  \"pad_token_id\": 0,\n",
       "  \"transformers_version\": \"4.26.0\"\n",
       "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
       "\n"
      ]
+    },
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Generate config GenerationConfig {\n",
+      "  \"decoder_start_token_id\": 0,\n",
+      "  \"eos_token_id\": 1,\n",
+      "  \"pad_token_id\": 0,\n",
+      "  \"transformers_version\": \"4.26.0\"\n",
+      "}\n",
+      "\n",
+      "Saving model checkpoint to C:\\Users\\vjmar\\Documents\\1. Code\\0. Work-Macro4\\T5Training\\checkpoint-20245\n",
+      "Configuration saved in C:\\Users\\vjmar\\Documents\\1. Code\\0. Work-Macro4\\T5Training\\checkpoint-20245\\config.json\n",
+      "Configuration saved in C:\\Users\\vjmar\\Documents\\1. Code\\0. Work-Macro4\\T5Training\\checkpoint-20245\\generation_config.json\n",
+      "Model weights saved in C:\\Users\\vjmar\\Documents\\1. Code\\0. Work-Macro4\\T5Training\\checkpoint-20245\\pytorch_model.bin\n",
+      "Deleting older checkpoint [C:\\Users\\vjmar\\Documents\\1. Code\\0. Work-Macro4\\T5Training\\checkpoint-8098] due to args.save_total_limit\n",
+      "\n",
+      "\n",
+      "Training completed. Do not forget to share your model on huggingface.co/models =)\n",
+      "\n",
+      "\n",
+      "Loading best model from C:\\Users\\vjmar\\Documents\\1. Code\\0. Work-Macro4\\T5Training\\checkpoint-20245 (score: 0.03408432751893997).\n",
+      "Saving model checkpoint to C:\\Users\\vjmar\\Documents\\1. Code\\0. Work-Macro4\\T5Training\\output\n",
+      "Configuration saved in C:\\Users\\vjmar\\Documents\\1. Code\\0. Work-Macro4\\T5Training\\output\\config.json\n",
+      "Configuration saved in C:\\Users\\vjmar\\Documents\\1. Code\\0. Work-Macro4\\T5Training\\output\\generation_config.json\n",
+      "Model weights saved in C:\\Users\\vjmar\\Documents\\1. Code\\0. Work-Macro4\\T5Training\\output\\pytorch_model.bin\n",
+      "Saving model checkpoint to C:\\Users\\vjmar\\Documents\\1. Code\\0. Work-Macro4\\T5Training\n",
+      "Configuration saved in C:\\Users\\vjmar\\Documents\\1. Code\\0. Work-Macro4\\T5Training\\config.json\n",
+      "Configuration saved in C:\\Users\\vjmar\\Documents\\1. Code\\0. Work-Macro4\\T5Training\\generation_config.json\n",
+      "Model weights saved in C:\\Users\\vjmar\\Documents\\1. Code\\0. Work-Macro4\\T5Training\\pytorch_model.bin\n",
+      "Several commits (2) will be pushed upstream.\n",
+      "WARNING:huggingface_hub.repository:Several commits (2) will be pushed upstream.\n",
+      "The progress bars may be unreliable.\n",
+      "WARNING:huggingface_hub.repository:The progress bars may be unreliable.\n",
+      "Upload file output/pytorch_model.bin:   0%|                                                                                                      | 32.0k/850M [00:00<?, ?B/s]\n",
+      "Upload file output/pytorch_model.bin:  91%|██████████████████████████████████████████████████████████████████████████████████████▊        | 777M/850M [08:12<00:37, 2.08MB/s]\u001b[A"
+     ]
     }
    ],
    "source": [