End of training

Browse files

Files changed (9) hide show

.ipynb_checkpoints/README-checkpoint.md +77 -0
.ipynb_checkpoints/all_results-checkpoint.json +8 -0
.ipynb_checkpoints/config-checkpoint.json +64 -0
.ipynb_checkpoints/train_results-checkpoint.json +8 -0
.ipynb_checkpoints/trainer_state-checkpoint.json +220 -0
all_results.json +13 -0
eval_results.json +8 -0
train_results.json +8 -0
trainer_state.json +220 -0

.ipynb_checkpoints/README-checkpoint.md ADDED Viewed

	@@ -0,0 +1,77 @@

+---
+license: apache-2.0
+tags:
+- generated_from_trainer
+datasets:
+- image_folder
+metrics:
+- accuracy
+model-index:
+- name: swin-tiny-patch4-window7-224-finetuned-eurosat
+  results:
+  - task:
+      name: Image Classification
+      type: image-classification
+    dataset:
+      name: image_folder
+      type: image_folder
+      args: default
+    metrics:
+    - name: Accuracy
+      type: accuracy
+      value: 0.9688888888888889
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# swin-tiny-patch4-window7-224-finetuned-eurosat
+This model is a fine-tuned version of [microsoft/swin-tiny-patch4-window7-224](https://huggingface.co/microsoft/swin-tiny-patch4-window7-224) on the image_folder dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.0866
+- Accuracy: 0.9689
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 5e-05
+- train_batch_size: 64
+- eval_batch_size: 64
+- seed: 42
+- gradient_accumulation_steps: 4
+- total_train_batch_size: 256
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- lr_scheduler_warmup_ratio: 0.1
+- num_epochs: 3
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Accuracy |
+|:-------------:|:-----:|:----:|:---------------:|:--------:|
+| 0.3046        | 1.0   | 95   | 0.1547          | 0.9452   |
+| 0.191         | 2.0   | 190  | 0.1161          | 0.9559   |
+| 0.1701        | 3.0   | 285  | 0.0866          | 0.9689   |
+### Framework versions
+- Transformers 4.19.2
+- Pytorch 1.11.0
+- Datasets 2.2.2
+- Tokenizers 0.12.1

.ipynb_checkpoints/all_results-checkpoint.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 3.0,
+    "total_flos": 1.8124066505760768e+18,
+    "train_loss": 0.3941639829100224,
+    "train_runtime": 487.9007,
+    "train_samples_per_second": 149.416,
+    "train_steps_per_second": 0.584
+}

.ipynb_checkpoints/config-checkpoint.json ADDED Viewed

	@@ -0,0 +1,64 @@

+{
+  "_name_or_path": "microsoft/swin-tiny-patch4-window7-224",
+  "architectures": [
+    "SwinForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "depths": [
+    2,
+    2,
+    6,
+    2
+  ],
+  "drop_path_rate": 0.1,
+  "embed_dim": 96,
+  "encoder_stride": 32,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "AnnualCrop",
+    "1": "Forest",
+    "2": "HerbaceousVegetation",
+    "3": "Highway",
+    "4": "Industrial",
+    "5": "Pasture",
+    "6": "PermanentCrop",
+    "7": "Residential",
+    "8": "River",
+    "9": "SeaLake"
+  },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "label2id": {
+    "AnnualCrop": 0,
+    "Forest": 1,
+    "HerbaceousVegetation": 2,
+    "Highway": 3,
+    "Industrial": 4,
+    "Pasture": 5,
+    "PermanentCrop": 6,
+    "Residential": 7,
+    "River": 8,
+    "SeaLake": 9
+  },
+  "layer_norm_eps": 1e-05,
+  "mlp_ratio": 4.0,
+  "model_type": "swin",
+  "num_channels": 3,
+  "num_heads": [
+    3,
+    6,
+    12,
+    24
+  ],
+  "num_layers": 4,
+  "patch_size": 4,
+  "path_norm": true,
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.19.2",
+  "use_absolute_embeddings": false,
+  "window_size": 7
+}

.ipynb_checkpoints/train_results-checkpoint.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 3.0,
+    "total_flos": 1.8124066505760768e+18,
+    "train_loss": 0.3941639829100224,
+    "train_runtime": 487.9007,
+    "train_samples_per_second": 149.416,
+    "train_steps_per_second": 0.584
+}

.ipynb_checkpoints/trainer_state-checkpoint.json ADDED Viewed

	@@ -0,0 +1,220 @@

+{
+  "best_metric": 0.9688888888888889,
+  "best_model_checkpoint": "swin-tiny-patch4-window7-224-finetuned-eurosat/checkpoint-285",
+  "epoch": 3.0,
+  "global_step": 285,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.11,
+      "learning_rate": 1.7241379310344828e-05,
+      "loss": 2.2089,
+      "step": 10
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 3.4482758620689657e-05,
+      "loss": 1.769,
+      "step": 20
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 4.9804687500000004e-05,
+      "loss": 0.9443,
+      "step": 30
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 4.78515625e-05,
+      "loss": 0.5303,
+      "step": 40
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.58984375e-05,
+      "loss": 0.4221,
+      "step": 50
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 4.3945312500000005e-05,
+      "loss": 0.3781,
+      "step": 60
+    },
+    {
+      "epoch": 0.74,
+      "learning_rate": 4.1992187500000003e-05,
+      "loss": 0.3348,
+      "step": 70
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 4.00390625e-05,
+      "loss": 0.3034,
+      "step": 80
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 3.80859375e-05,
+      "loss": 0.3046,
+      "step": 90
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.9451851851851852,
+      "eval_loss": 0.15470224618911743,
+      "eval_runtime": 10.7878,
+      "eval_samples_per_second": 250.283,
+      "eval_steps_per_second": 3.986,
+      "step": 95
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 3.6132812500000005e-05,
+      "loss": 0.2883,
+      "step": 100
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 3.41796875e-05,
+      "loss": 0.2784,
+      "step": 110
+    },
+    {
+      "epoch": 1.26,
+      "learning_rate": 3.22265625e-05,
+      "loss": 0.2677,
+      "step": 120
+    },
+    {
+      "epoch": 1.37,
+      "learning_rate": 3.02734375e-05,
+      "loss": 0.2631,
+      "step": 130
+    },
+    {
+      "epoch": 1.47,
+      "learning_rate": 2.83203125e-05,
+      "loss": 0.2293,
+      "step": 140
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 2.63671875e-05,
+      "loss": 0.2219,
+      "step": 150
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 2.44140625e-05,
+      "loss": 0.2059,
+      "step": 160
+    },
+    {
+      "epoch": 1.79,
+      "learning_rate": 2.24609375e-05,
+      "loss": 0.2308,
+      "step": 170
+    },
+    {
+      "epoch": 1.89,
+      "learning_rate": 2.05078125e-05,
+      "loss": 0.1977,
+      "step": 180
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 1.85546875e-05,
+      "loss": 0.191,
+      "step": 190
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.955925925925926,
+      "eval_loss": 0.11611586064100266,
+      "eval_runtime": 8.8072,
+      "eval_samples_per_second": 306.569,
+      "eval_steps_per_second": 4.882,
+      "step": 190
+    },
+    {
+      "epoch": 2.11,
+      "learning_rate": 1.66015625e-05,
+      "loss": 0.1861,
+      "step": 200
+    },
+    {
+      "epoch": 2.21,
+      "learning_rate": 1.4648437500000001e-05,
+      "loss": 0.1912,
+      "step": 210
+    },
+    {
+      "epoch": 2.32,
+      "learning_rate": 1.2695312500000001e-05,
+      "loss": 0.1704,
+      "step": 220
+    },
+    {
+      "epoch": 2.42,
+      "learning_rate": 1.0742187500000001e-05,
+      "loss": 0.1792,
+      "step": 230
+    },
+    {
+      "epoch": 2.53,
+      "learning_rate": 8.789062500000001e-06,
+      "loss": 0.178,
+      "step": 240
+    },
+    {
+      "epoch": 2.63,
+      "learning_rate": 6.8359375e-06,
+      "loss": 0.1685,
+      "step": 250
+    },
+    {
+      "epoch": 2.74,
+      "learning_rate": 4.8828125e-06,
+      "loss": 0.1596,
+      "step": 260
+    },
+    {
+      "epoch": 2.84,
+      "learning_rate": 2.9296875e-06,
+      "loss": 0.1769,
+      "step": 270
+    },
+    {
+      "epoch": 2.95,
+      "learning_rate": 9.765625e-07,
+      "loss": 0.1701,
+      "step": 280
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9688888888888889,
+      "eval_loss": 0.08657249808311462,
+      "eval_runtime": 9.1811,
+      "eval_samples_per_second": 294.083,
+      "eval_steps_per_second": 4.684,
+      "step": 285
+    },
+    {
+      "epoch": 3.0,
+      "step": 285,
+      "total_flos": 1.8124066505760768e+18,
+      "train_loss": 0.3941639829100224,
+      "train_runtime": 487.9007,
+      "train_samples_per_second": 149.416,
+      "train_steps_per_second": 0.584
+    }
+  ],
+  "max_steps": 285,
+  "num_train_epochs": 3,
+  "total_flos": 1.8124066505760768e+18,
+  "trial_name": null,
+  "trial_params": null
+}

all_results.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+    "epoch": 3.0,
+    "eval_accuracy": 0.9688888888888889,
+    "eval_loss": 0.08657249808311462,
+    "eval_runtime": 9.4322,
+    "eval_samples_per_second": 286.255,
+    "eval_steps_per_second": 4.559,
+    "total_flos": 1.8124066505760768e+18,
+    "train_loss": 0.3941639829100224,
+    "train_runtime": 487.9007,
+    "train_samples_per_second": 149.416,
+    "train_steps_per_second": 0.584
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 3.0,
+    "eval_accuracy": 0.9688888888888889,
+    "eval_loss": 0.08657249808311462,
+    "eval_runtime": 9.4322,
+    "eval_samples_per_second": 286.255,
+    "eval_steps_per_second": 4.559
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 3.0,
+    "total_flos": 1.8124066505760768e+18,
+    "train_loss": 0.3941639829100224,
+    "train_runtime": 487.9007,
+    "train_samples_per_second": 149.416,
+    "train_steps_per_second": 0.584
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,220 @@

+{
+  "best_metric": 0.9688888888888889,
+  "best_model_checkpoint": "swin-tiny-patch4-window7-224-finetuned-eurosat/checkpoint-285",
+  "epoch": 3.0,
+  "global_step": 285,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.11,
+      "learning_rate": 1.7241379310344828e-05,
+      "loss": 2.2089,
+      "step": 10
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 3.4482758620689657e-05,
+      "loss": 1.769,
+      "step": 20
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 4.9804687500000004e-05,
+      "loss": 0.9443,
+      "step": 30
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 4.78515625e-05,
+      "loss": 0.5303,
+      "step": 40
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.58984375e-05,
+      "loss": 0.4221,
+      "step": 50
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 4.3945312500000005e-05,
+      "loss": 0.3781,
+      "step": 60
+    },
+    {
+      "epoch": 0.74,
+      "learning_rate": 4.1992187500000003e-05,
+      "loss": 0.3348,
+      "step": 70
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 4.00390625e-05,
+      "loss": 0.3034,
+      "step": 80
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 3.80859375e-05,
+      "loss": 0.3046,
+      "step": 90
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.9451851851851852,
+      "eval_loss": 0.15470224618911743,
+      "eval_runtime": 10.7878,
+      "eval_samples_per_second": 250.283,
+      "eval_steps_per_second": 3.986,
+      "step": 95
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 3.6132812500000005e-05,
+      "loss": 0.2883,
+      "step": 100
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 3.41796875e-05,
+      "loss": 0.2784,
+      "step": 110
+    },
+    {
+      "epoch": 1.26,
+      "learning_rate": 3.22265625e-05,
+      "loss": 0.2677,
+      "step": 120
+    },
+    {
+      "epoch": 1.37,
+      "learning_rate": 3.02734375e-05,
+      "loss": 0.2631,
+      "step": 130
+    },
+    {
+      "epoch": 1.47,
+      "learning_rate": 2.83203125e-05,
+      "loss": 0.2293,
+      "step": 140
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 2.63671875e-05,
+      "loss": 0.2219,
+      "step": 150
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 2.44140625e-05,
+      "loss": 0.2059,
+      "step": 160
+    },
+    {
+      "epoch": 1.79,
+      "learning_rate": 2.24609375e-05,
+      "loss": 0.2308,
+      "step": 170
+    },
+    {
+      "epoch": 1.89,
+      "learning_rate": 2.05078125e-05,
+      "loss": 0.1977,
+      "step": 180
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 1.85546875e-05,
+      "loss": 0.191,
+      "step": 190
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.955925925925926,
+      "eval_loss": 0.11611586064100266,
+      "eval_runtime": 8.8072,
+      "eval_samples_per_second": 306.569,
+      "eval_steps_per_second": 4.882,
+      "step": 190
+    },
+    {
+      "epoch": 2.11,
+      "learning_rate": 1.66015625e-05,
+      "loss": 0.1861,
+      "step": 200
+    },
+    {
+      "epoch": 2.21,
+      "learning_rate": 1.4648437500000001e-05,
+      "loss": 0.1912,
+      "step": 210
+    },
+    {
+      "epoch": 2.32,
+      "learning_rate": 1.2695312500000001e-05,
+      "loss": 0.1704,
+      "step": 220
+    },
+    {
+      "epoch": 2.42,
+      "learning_rate": 1.0742187500000001e-05,
+      "loss": 0.1792,
+      "step": 230
+    },
+    {
+      "epoch": 2.53,
+      "learning_rate": 8.789062500000001e-06,
+      "loss": 0.178,
+      "step": 240
+    },
+    {
+      "epoch": 2.63,
+      "learning_rate": 6.8359375e-06,
+      "loss": 0.1685,
+      "step": 250
+    },
+    {
+      "epoch": 2.74,
+      "learning_rate": 4.8828125e-06,
+      "loss": 0.1596,
+      "step": 260
+    },
+    {
+      "epoch": 2.84,
+      "learning_rate": 2.9296875e-06,
+      "loss": 0.1769,
+      "step": 270
+    },
+    {
+      "epoch": 2.95,
+      "learning_rate": 9.765625e-07,
+      "loss": 0.1701,
+      "step": 280
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9688888888888889,
+      "eval_loss": 0.08657249808311462,
+      "eval_runtime": 9.1811,
+      "eval_samples_per_second": 294.083,
+      "eval_steps_per_second": 4.684,
+      "step": 285
+    },
+    {
+      "epoch": 3.0,
+      "step": 285,
+      "total_flos": 1.8124066505760768e+18,
+      "train_loss": 0.3941639829100224,
+      "train_runtime": 487.9007,
+      "train_samples_per_second": 149.416,
+      "train_steps_per_second": 0.584
+    }
+  ],
+  "max_steps": 285,
+  "num_train_epochs": 3,
+  "total_flos": 1.8124066505760768e+18,
+  "trial_name": null,
+  "trial_params": null
+}