End of training

Browse files

Files changed (11) hide show

README.md +87 -0
all_results.json +13 -0
config.json +53 -0
eval_results.json +8 -0
model.safetensors +3 -0
preprocessor_config.json +22 -0
runs/Nov23_15-21-40_435ad433beae/events.out.tfevents.1700752973.435ad433beae.439.0 +3 -0
runs/Nov23_15-21-40_435ad433beae/events.out.tfevents.1700753936.435ad433beae.439.1 +3 -0
train_results.json +8 -0
trainer_state.json +502 -0
training_args.bin +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,87 @@

+---
+license: apache-2.0
+base_model: facebook/convnextv2-tiny-1k-224
+tags:
+- generated_from_trainer
+datasets:
+- beans
+metrics:
+- accuracy
+model-index:
+- name: convnextv2-tiny-1k-224-finetuned-beans
+  results:
+  - task:
+      name: Image Classification
+      type: image-classification
+    dataset:
+      name: beans
+      type: beans
+      config: default
+      split: validation
+      args: default
+    metrics:
+    - name: Accuracy
+      type: accuracy
+      value: 0.8120300751879699
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# convnextv2-tiny-1k-224-finetuned-beans
+This model is a fine-tuned version of [facebook/convnextv2-tiny-1k-224](https://huggingface.co/facebook/convnextv2-tiny-1k-224) on the beans dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.5389
+- Accuracy: 0.8120
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 5e-05
+- train_batch_size: 4
+- eval_batch_size: 4
+- seed: 42
+- gradient_accumulation_steps: 4
+- total_train_batch_size: 16
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- lr_scheduler_warmup_ratio: 0.1
+- num_epochs: 10
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Accuracy |
+|:-------------:|:-----:|:----:|:---------------:|:--------:|
+| 0.2179        | 0.99  | 64   | 0.5407          | 0.7293   |
+| 0.1033        | 1.99  | 129  | 0.6816          | 0.7068   |
+| 0.0425        | 3.0   | 194  | 0.5600          | 0.7820   |
+| 0.0017        | 4.0   | 259  | 0.6064          | 0.7444   |
+| 0.0035        | 4.99  | 323  | 0.6192          | 0.7895   |
+| 0.0005        | 5.99  | 388  | 0.5389          | 0.8120   |
+| 0.0003        | 7.0   | 453  | 0.6144          | 0.7895   |
+| 0.0002        | 8.0   | 518  | 0.6294          | 0.7895   |
+| 0.0002        | 8.99  | 582  | 0.6324          | 0.7895   |
+| 0.0002        | 9.88  | 640  | 0.6339          | 0.7895   |
+### Framework versions
+- Transformers 4.35.2
+- Pytorch 2.1.0+cu118
+- Datasets 2.15.0
+- Tokenizers 0.15.0

all_results.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+    "epoch": 9.88,
+    "eval_accuracy": 0.8120300751879699,
+    "eval_loss": 0.538909375667572,
+    "eval_runtime": 1.7053,
+    "eval_samples_per_second": 77.99,
+    "eval_steps_per_second": 19.937,
+    "total_flos": 1.2819370691970002e+18,
+    "train_loss": 0.08128333170207043,
+    "train_runtime": 961.2553,
+    "train_samples_per_second": 10.757,
+    "train_steps_per_second": 0.666
+}

config.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "_name_or_path": "facebook/convnextv2-tiny-1k-224",
+  "architectures": [
+    "ConvNextV2ForImageClassification"
+  ],
+  "depths": [
+    3,
+    3,
+    9,
+    3
+  ],
+  "drop_path_rate": 0.0,
+  "hidden_act": "gelu",
+  "hidden_sizes": [
+    96,
+    192,
+    384,
+    768
+  ],
+  "id2label": {
+    "0": "angular_leaf_spot",
+    "1": "bean_rust",
+    "2": "healthy"
+  },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "label2id": {
+    "angular_leaf_spot": 0,
+    "bean_rust": 1,
+    "healthy": 2
+  },
+  "layer_norm_eps": 1e-12,
+  "model_type": "convnextv2",
+  "num_channels": 3,
+  "num_stages": 4,
+  "out_features": [
+    "stage4"
+  ],
+  "out_indices": [
+    4
+  ],
+  "patch_size": 4,
+  "problem_type": "single_label_classification",
+  "stage_names": [
+    "stem",
+    "stage1",
+    "stage2",
+    "stage3",
+    "stage4"
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.35.2"
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 9.88,
+    "eval_accuracy": 0.8120300751879699,
+    "eval_loss": 0.538909375667572,
+    "eval_runtime": 1.7053,
+    "eval_samples_per_second": 77.99,
+    "eval_steps_per_second": 19.937
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1aa0a94e5c17b125bb5ca0132370bafb00f8ea69f675dba55cc76a06be4a67c3
+size 111498892

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,22 @@

+{
+  "crop_pct": 0.875,
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.485,
+    0.456,
+    0.406
+  ],
+  "image_processor_type": "ConvNextImageProcessor",
+  "image_std": [
+    0.229,
+    0.224,
+    0.225
+  ],
+  "resample": 3,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "shortest_edge": 224
+  }
+}

runs/Nov23_15-21-40_435ad433beae/events.out.tfevents.1700752973.435ad433beae.439.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8143ba9d66e2099c5693bf18c2b6a64609bb4501f54986b6ded2d53debc1f85e
+size 18070

runs/Nov23_15-21-40_435ad433beae/events.out.tfevents.1700753936.435ad433beae.439.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8725883c4261bc2c2cc80e843a39cca064a63077009f3595a3b4eed656c6257a
+size 411

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 9.88,
+    "total_flos": 1.2819370691970002e+18,
+    "train_loss": 0.08128333170207043,
+    "train_runtime": 961.2553,
+    "train_samples_per_second": 10.757,
+    "train_steps_per_second": 0.666
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,502 @@

+{
+  "best_metric": 0.8120300751879699,
+  "best_model_checkpoint": "convnextv2-tiny-1k-224-finetuned-beans/checkpoint-388",
+  "epoch": 9.884169884169884,
+  "eval_steps": 500,
+  "global_step": 640,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.15,
+      "learning_rate": 7.8125e-06,
+      "loss": 1.0872,
+      "step": 10
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 1.5625e-05,
+      "loss": 0.9814,
+      "step": 20
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 2.34375e-05,
+      "loss": 0.7814,
+      "step": 30
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 3.125e-05,
+      "loss": 0.4805,
+      "step": 40
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 3.90625e-05,
+      "loss": 0.3533,
+      "step": 50
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 4.6875e-05,
+      "loss": 0.2179,
+      "step": 60
+    },
+    {
+      "epoch": 0.99,
+      "eval_accuracy": 0.7293233082706767,
+      "eval_loss": 0.5406778454780579,
+      "eval_runtime": 1.5242,
+      "eval_samples_per_second": 87.261,
+      "eval_steps_per_second": 22.307,
+      "step": 64
+    },
+    {
+      "epoch": 1.08,
+      "learning_rate": 4.947916666666667e-05,
+      "loss": 0.1219,
+      "step": 70
+    },
+    {
+      "epoch": 1.24,
+      "learning_rate": 4.8611111111111115e-05,
+      "loss": 0.0905,
+      "step": 80
+    },
+    {
+      "epoch": 1.39,
+      "learning_rate": 4.774305555555556e-05,
+      "loss": 0.0584,
+      "step": 90
+    },
+    {
+      "epoch": 1.54,
+      "learning_rate": 4.6875e-05,
+      "loss": 0.0654,
+      "step": 100
+    },
+    {
+      "epoch": 1.7,
+      "learning_rate": 4.6006944444444444e-05,
+      "loss": 0.132,
+      "step": 110
+    },
+    {
+      "epoch": 1.85,
+      "learning_rate": 4.5138888888888894e-05,
+      "loss": 0.1033,
+      "step": 120
+    },
+    {
+      "epoch": 1.99,
+      "eval_accuracy": 0.706766917293233,
+      "eval_loss": 0.6816055774688721,
+      "eval_runtime": 1.9031,
+      "eval_samples_per_second": 69.885,
+      "eval_steps_per_second": 17.865,
+      "step": 129
+    },
+    {
+      "epoch": 2.01,
+      "learning_rate": 4.4270833333333337e-05,
+      "loss": 0.088,
+      "step": 130
+    },
+    {
+      "epoch": 2.16,
+      "learning_rate": 4.340277777777778e-05,
+      "loss": 0.0408,
+      "step": 140
+    },
+    {
+      "epoch": 2.32,
+      "learning_rate": 4.253472222222222e-05,
+      "loss": 0.018,
+      "step": 150
+    },
+    {
+      "epoch": 2.47,
+      "learning_rate": 4.166666666666667e-05,
+      "loss": 0.0828,
+      "step": 160
+    },
+    {
+      "epoch": 2.63,
+      "learning_rate": 4.0798611111111115e-05,
+      "loss": 0.1316,
+      "step": 170
+    },
+    {
+      "epoch": 2.78,
+      "learning_rate": 3.993055555555556e-05,
+      "loss": 0.0105,
+      "step": 180
+    },
+    {
+      "epoch": 2.93,
+      "learning_rate": 3.90625e-05,
+      "loss": 0.0425,
+      "step": 190
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.7819548872180451,
+      "eval_loss": 0.5600232481956482,
+      "eval_runtime": 1.5091,
+      "eval_samples_per_second": 88.131,
+      "eval_steps_per_second": 22.53,
+      "step": 194
+    },
+    {
+      "epoch": 3.09,
+      "learning_rate": 3.8194444444444444e-05,
+      "loss": 0.0369,
+      "step": 200
+    },
+    {
+      "epoch": 3.24,
+      "learning_rate": 3.7326388888888893e-05,
+      "loss": 0.0354,
+      "step": 210
+    },
+    {
+      "epoch": 3.4,
+      "learning_rate": 3.6458333333333336e-05,
+      "loss": 0.0216,
+      "step": 220
+    },
+    {
+      "epoch": 3.55,
+      "learning_rate": 3.559027777777778e-05,
+      "loss": 0.0406,
+      "step": 230
+    },
+    {
+      "epoch": 3.71,
+      "learning_rate": 3.472222222222222e-05,
+      "loss": 0.0409,
+      "step": 240
+    },
+    {
+      "epoch": 3.86,
+      "learning_rate": 3.385416666666667e-05,
+      "loss": 0.0017,
+      "step": 250
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.7443609022556391,
+      "eval_loss": 0.6063990592956543,
+      "eval_runtime": 1.484,
+      "eval_samples_per_second": 89.625,
+      "eval_steps_per_second": 22.912,
+      "step": 259
+    },
+    {
+      "epoch": 4.02,
+      "learning_rate": 3.2986111111111115e-05,
+      "loss": 0.0714,
+      "step": 260
+    },
+    {
+      "epoch": 4.17,
+      "learning_rate": 3.211805555555556e-05,
+      "loss": 0.025,
+      "step": 270
+    },
+    {
+      "epoch": 4.32,
+      "learning_rate": 3.125e-05,
+      "loss": 0.0007,
+      "step": 280
+    },
+    {
+      "epoch": 4.48,
+      "learning_rate": 3.0381944444444444e-05,
+      "loss": 0.0006,
+      "step": 290
+    },
+    {
+      "epoch": 4.63,
+      "learning_rate": 2.951388888888889e-05,
+      "loss": 0.0053,
+      "step": 300
+    },
+    {
+      "epoch": 4.79,
+      "learning_rate": 2.8645833333333333e-05,
+      "loss": 0.002,
+      "step": 310
+    },
+    {
+      "epoch": 4.94,
+      "learning_rate": 2.777777777777778e-05,
+      "loss": 0.0035,
+      "step": 320
+    },
+    {
+      "epoch": 4.99,
+      "eval_accuracy": 0.7894736842105263,
+      "eval_loss": 0.6192318201065063,
+      "eval_runtime": 1.8151,
+      "eval_samples_per_second": 73.275,
+      "eval_steps_per_second": 18.732,
+      "step": 323
+    },
+    {
+      "epoch": 5.1,
+      "learning_rate": 2.6909722222222222e-05,
+      "loss": 0.0005,
+      "step": 330
+    },
+    {
+      "epoch": 5.25,
+      "learning_rate": 2.604166666666667e-05,
+      "loss": 0.0004,
+      "step": 340
+    },
+    {
+      "epoch": 5.41,
+      "learning_rate": 2.517361111111111e-05,
+      "loss": 0.0005,
+      "step": 350
+    },
+    {
+      "epoch": 5.56,
+      "learning_rate": 2.4305555555555558e-05,
+      "loss": 0.0003,
+      "step": 360
+    },
+    {
+      "epoch": 5.71,
+      "learning_rate": 2.34375e-05,
+      "loss": 0.0199,
+      "step": 370
+    },
+    {
+      "epoch": 5.87,
+      "learning_rate": 2.2569444444444447e-05,
+      "loss": 0.0005,
+      "step": 380
+    },
+    {
+      "epoch": 5.99,
+      "eval_accuracy": 0.8120300751879699,
+      "eval_loss": 0.538909375667572,
+      "eval_runtime": 2.1559,
+      "eval_samples_per_second": 61.691,
+      "eval_steps_per_second": 15.771,
+      "step": 388
+    },
+    {
+      "epoch": 6.02,
+      "learning_rate": 2.170138888888889e-05,
+      "loss": 0.001,
+      "step": 390
+    },
+    {
+      "epoch": 6.18,
+      "learning_rate": 2.0833333333333336e-05,
+      "loss": 0.0003,
+      "step": 400
+    },
+    {
+      "epoch": 6.33,
+      "learning_rate": 1.996527777777778e-05,
+      "loss": 0.0003,
+      "step": 410
+    },
+    {
+      "epoch": 6.49,
+      "learning_rate": 1.9097222222222222e-05,
+      "loss": 0.0004,
+      "step": 420
+    },
+    {
+      "epoch": 6.64,
+      "learning_rate": 1.8229166666666668e-05,
+      "loss": 0.0003,
+      "step": 430
+    },
+    {
+      "epoch": 6.8,
+      "learning_rate": 1.736111111111111e-05,
+      "loss": 0.0003,
+      "step": 440
+    },
+    {
+      "epoch": 6.95,
+      "learning_rate": 1.6493055555555557e-05,
+      "loss": 0.0003,
+      "step": 450
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.7894736842105263,
+      "eval_loss": 0.6144049763679504,
+      "eval_runtime": 1.5163,
+      "eval_samples_per_second": 87.716,
+      "eval_steps_per_second": 22.424,
+      "step": 453
+    },
+    {
+      "epoch": 7.1,
+      "learning_rate": 1.5625e-05,
+      "loss": 0.0003,
+      "step": 460
+    },
+    {
+      "epoch": 7.26,
+      "learning_rate": 1.4756944444444445e-05,
+      "loss": 0.0002,
+      "step": 470
+    },
+    {
+      "epoch": 7.41,
+      "learning_rate": 1.388888888888889e-05,
+      "loss": 0.0002,
+      "step": 480
+    },
+    {
+      "epoch": 7.57,
+      "learning_rate": 1.3020833333333334e-05,
+      "loss": 0.0002,
+      "step": 490
+    },
+    {
+      "epoch": 7.72,
+      "learning_rate": 1.2152777777777779e-05,
+      "loss": 0.0003,
+      "step": 500
+    },
+    {
+      "epoch": 7.88,
+      "learning_rate": 1.1284722222222223e-05,
+      "loss": 0.0002,
+      "step": 510
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.7894736842105263,
+      "eval_loss": 0.6294459104537964,
+      "eval_runtime": 1.5209,
+      "eval_samples_per_second": 87.448,
+      "eval_steps_per_second": 22.355,
+      "step": 518
+    },
+    {
+      "epoch": 8.03,
+      "learning_rate": 1.0416666666666668e-05,
+      "loss": 0.0002,
+      "step": 520
+    },
+    {
+      "epoch": 8.19,
+      "learning_rate": 9.548611111111111e-06,
+      "loss": 0.0002,
+      "step": 530
+    },
+    {
+      "epoch": 8.34,
+      "learning_rate": 8.680555555555556e-06,
+      "loss": 0.0002,
+      "step": 540
+    },
+    {
+      "epoch": 8.49,
+      "learning_rate": 7.8125e-06,
+      "loss": 0.0002,
+      "step": 550
+    },
+    {
+      "epoch": 8.65,
+      "learning_rate": 6.944444444444445e-06,
+      "loss": 0.0002,
+      "step": 560
+    },
+    {
+      "epoch": 8.8,
+      "learning_rate": 6.076388888888889e-06,
+      "loss": 0.0002,
+      "step": 570
+    },
+    {
+      "epoch": 8.96,
+      "learning_rate": 5.208333333333334e-06,
+      "loss": 0.0002,
+      "step": 580
+    },
+    {
+      "epoch": 8.99,
+      "eval_accuracy": 0.7894736842105263,
+      "eval_loss": 0.6324166059494019,
+      "eval_runtime": 2.0107,
+      "eval_samples_per_second": 66.147,
+      "eval_steps_per_second": 16.91,
+      "step": 582
+    },
+    {
+      "epoch": 9.11,
+      "learning_rate": 4.340277777777778e-06,
+      "loss": 0.0002,
+      "step": 590
+    },
+    {
+      "epoch": 9.27,
+      "learning_rate": 3.4722222222222224e-06,
+      "loss": 0.0002,
+      "step": 600
+    },
+    {
+      "epoch": 9.42,
+      "learning_rate": 2.604166666666667e-06,
+      "loss": 0.0002,
+      "step": 610
+    },
+    {
+      "epoch": 9.58,
+      "learning_rate": 1.7361111111111112e-06,
+      "loss": 0.0002,
+      "step": 620
+    },
+    {
+      "epoch": 9.73,
+      "learning_rate": 8.680555555555556e-07,
+      "loss": 0.0002,
+      "step": 630
+    },
+    {
+      "epoch": 9.88,
+      "learning_rate": 0.0,
+      "loss": 0.0002,
+      "step": 640
+    },
+    {
+      "epoch": 9.88,
+      "eval_accuracy": 0.7894736842105263,
+      "eval_loss": 0.6338961124420166,
+      "eval_runtime": 1.9752,
+      "eval_samples_per_second": 67.334,
+      "eval_steps_per_second": 17.213,
+      "step": 640
+    },
+    {
+      "epoch": 9.88,
+      "step": 640,
+      "total_flos": 1.2819370691970002e+18,
+      "train_loss": 0.08128333170207043,
+      "train_runtime": 961.2553,
+      "train_samples_per_second": 10.757,
+      "train_steps_per_second": 0.666
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 640,
+  "num_train_epochs": 10,
+  "save_steps": 500,
+  "total_flos": 1.2819370691970002e+18,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:49856b37d6237cf06013dc0a351859ca2ad34d97f97391664b0fc505a68eb318
+size 4600