Model save

Browse files

Files changed (9) hide show

README.md +13 -8
all_results.json +8 -8
eval_results.json +4 -4
model.safetensors +1 -1
runs/Dec15_03-35-22_d2a76fcee09b/events.out.tfevents.1702611805.d2a76fcee09b.2614.17 +3 -0
runs/Dec15_03-46-10_d2a76fcee09b/events.out.tfevents.1702611985.d2a76fcee09b.36815.0 +3 -0
train_results.json +4 -4
trainer_state.json +113 -113
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -22,7 +22,7 @@ model-index:
     metrics:
     - name: Accuracy
       type: accuracy
-      value: 0.9083333333333333
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -32,8 +32,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.5528
-- Accuracy: 0.9083
 ## Model description
@@ -58,17 +58,22 @@ The following hyperparameters were used during training:
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 5
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
-| 0.0009        | 1.11  | 100  | 0.7068          | 0.8713   |
-| 0.0039        | 2.22  | 200  | 0.6391          | 0.8991   |
-| 0.0014        | 3.33  | 300  | 0.5536          | 0.9056   |
-| 0.0018        | 4.44  | 400  | 0.5528          | 0.9083   |
 ### Framework versions

     metrics:
     - name: Accuracy
       type: accuracy
+      value: 0.9175925925925926
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.3201
+- Accuracy: 0.9176
 ## Model description
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 10
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
+| 0.6539        | 1.11  | 100  | 0.8063          | 0.75     |
+| 0.2553        | 2.22  | 200  | 0.5555          | 0.8352   |
+| 0.1909        | 3.33  | 300  | 0.5217          | 0.8454   |
+| 0.0999        | 4.44  | 400  | 0.5075          | 0.8722   |
+| 0.0666        | 5.56  | 500  | 0.4633          | 0.8769   |
+| 0.0392        | 6.67  | 600  | 0.4614          | 0.8741   |
+| 0.0111        | 7.78  | 700  | 0.3574          | 0.9102   |
+| 0.0122        | 8.89  | 800  | 0.3159          | 0.9167   |
+| 0.0112        | 10.0  | 900  | 0.3201          | 0.9176   |
 ### Framework versions

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
     "epoch": 5.0,
     "eval_accuracy": 0.9083333333333333,
-    "eval_loss": 0.5385243892669678,
-    "eval_runtime": 15.071,
-    "eval_samples_per_second": 71.661,
-    "eval_steps_per_second": 8.958,
     "total_flos": 1.6739319895474176e+18,
-    "train_loss": 0.0525758553068671,
-    "train_runtime": 438.9135,
-    "train_samples_per_second": 49.212,
-    "train_steps_per_second": 1.025
 }

 {
     "epoch": 5.0,
     "eval_accuracy": 0.9083333333333333,
+    "eval_loss": 0.5533814430236816,
+    "eval_runtime": 13.9693,
+    "eval_samples_per_second": 77.312,
+    "eval_steps_per_second": 9.664,
     "total_flos": 1.6739319895474176e+18,
+    "train_loss": 0.015028678889438096,
+    "train_runtime": 430.7019,
+    "train_samples_per_second": 50.151,
+    "train_steps_per_second": 1.045
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 5.0,
     "eval_accuracy": 0.9083333333333333,
-    "eval_loss": 0.5385243892669678,
-    "eval_runtime": 15.071,
-    "eval_samples_per_second": 71.661,
-    "eval_steps_per_second": 8.958
 }

 {
     "epoch": 5.0,
     "eval_accuracy": 0.9083333333333333,
+    "eval_loss": 0.5533814430236816,
+    "eval_runtime": 13.9693,
+    "eval_samples_per_second": 77.312,
+    "eval_steps_per_second": 9.664
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:52ffdef6ed6dcc0e0387cfae75079af794dfdaa5c63cfb4f5f306726b6a1fae6
 size 343245508

 version https://git-lfs.github.com/spec/v1
+oid sha256:8b06ae38c0b51f1466eb373ce6ecf98bcd0f7492b3e486f681a11a79fadb6687
 size 343245508

runs/Dec15_03-35-22_d2a76fcee09b/events.out.tfevents.1702611805.d2a76fcee09b.2614.17 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ef5a4d9e5c80a1ec0df54a951c33e6b5eaf4a17c8a44f225ab9519d182b88296
+size 411

runs/Dec15_03-46-10_d2a76fcee09b/events.out.tfevents.1702611985.d2a76fcee09b.36815.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:51bea51287a39b0211a5910e37918c77b30a676645f539f5198555ed6af89233
+size 21776

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 5.0,
     "total_flos": 1.6739319895474176e+18,
-    "train_loss": 0.0525758553068671,
-    "train_runtime": 438.9135,
-    "train_samples_per_second": 49.212,
-    "train_steps_per_second": 1.025
 }

 {
     "epoch": 5.0,
     "total_flos": 1.6739319895474176e+18,
+    "train_loss": 0.015028678889438096,
+    "train_runtime": 430.7019,
+    "train_samples_per_second": 50.151,
+    "train_steps_per_second": 1.045
 }

trainer_state.json CHANGED Viewed

@@ -10,318 +10,318 @@
   "log_history": [
     {
       "epoch": 0.11,
-      "learning_rate": 0.0003911111111111111,
-      "loss": 0.0127,
       "step": 10
     },
     {
       "epoch": 0.22,
-      "learning_rate": 0.0003822222222222223,
-      "loss": 0.1644,
       "step": 20
     },
     {
       "epoch": 0.33,
-      "learning_rate": 0.0003733333333333334,
-      "loss": 0.2691,
       "step": 30
     },
     {
       "epoch": 0.44,
-      "learning_rate": 0.00036444444444444447,
-      "loss": 0.2196,
       "step": 40
     },
     {
       "epoch": 0.56,
-      "learning_rate": 0.00035555555555555557,
-      "loss": 0.1119,
       "step": 50
     },
     {
       "epoch": 0.67,
-      "learning_rate": 0.00034666666666666667,
-      "loss": 0.1708,
       "step": 60
     },
     {
       "epoch": 0.78,
-      "learning_rate": 0.00033777777777777777,
-      "loss": 0.2104,
       "step": 70
     },
     {
       "epoch": 0.89,
-      "learning_rate": 0.00032888888888888887,
-      "loss": 0.1343,
       "step": 80
     },
     {
       "epoch": 1.0,
-      "learning_rate": 0.00032,
-      "loss": 0.1185,
       "step": 90
     },
     {
       "epoch": 1.11,
-      "learning_rate": 0.0003111111111111111,
-      "loss": 0.1059,
       "step": 100
     },
     {
       "epoch": 1.11,
-      "eval_accuracy": 0.8546296296296296,
-      "eval_loss": 0.693325936794281,
-      "eval_runtime": 12.9043,
-      "eval_samples_per_second": 83.693,
-      "eval_steps_per_second": 10.462,
       "step": 100
     },
     {
       "epoch": 1.22,
-      "learning_rate": 0.0003022222222222222,
-      "loss": 0.0944,
       "step": 110
     },
     {
       "epoch": 1.33,
-      "learning_rate": 0.0002933333333333333,
-      "loss": 0.1009,
       "step": 120
     },
     {
       "epoch": 1.44,
-      "learning_rate": 0.0002844444444444445,
-      "loss": 0.0579,
       "step": 130
     },
     {
       "epoch": 1.56,
-      "learning_rate": 0.0002755555555555556,
-      "loss": 0.093,
       "step": 140
     },
     {
       "epoch": 1.67,
-      "learning_rate": 0.0002666666666666667,
-      "loss": 0.054,
       "step": 150
     },
     {
       "epoch": 1.78,
-      "learning_rate": 0.00025777777777777783,
-      "loss": 0.0366,
       "step": 160
     },
     {
       "epoch": 1.89,
-      "learning_rate": 0.0002488888888888889,
-      "loss": 0.027,
       "step": 170
     },
     {
       "epoch": 2.0,
-      "learning_rate": 0.00024,
-      "loss": 0.0369,
       "step": 180
     },
     {
       "epoch": 2.11,
-      "learning_rate": 0.0002311111111111111,
-      "loss": 0.0354,
       "step": 190
     },
     {
       "epoch": 2.22,
-      "learning_rate": 0.00022222222222222223,
-      "loss": 0.02,
       "step": 200
     },
     {
       "epoch": 2.22,
-      "eval_accuracy": 0.875,
-      "eval_loss": 0.656458854675293,
-      "eval_runtime": 12.7588,
-      "eval_samples_per_second": 84.647,
-      "eval_steps_per_second": 10.581,
       "step": 200
     },
     {
       "epoch": 2.33,
-      "learning_rate": 0.00021333333333333333,
-      "loss": 0.0236,
       "step": 210
     },
     {
       "epoch": 2.44,
-      "learning_rate": 0.00020444444444444443,
-      "loss": 0.032,
       "step": 220
     },
     {
       "epoch": 2.56,
-      "learning_rate": 0.00019555555555555556,
-      "loss": 0.0369,
       "step": 230
     },
     {
       "epoch": 2.67,
-      "learning_rate": 0.0001866666666666667,
-      "loss": 0.0339,
       "step": 240
     },
     {
       "epoch": 2.78,
-      "learning_rate": 0.00017777777777777779,
-      "loss": 0.0207,
       "step": 250
     },
     {
       "epoch": 2.89,
-      "learning_rate": 0.00016888888888888889,
-      "loss": 0.0291,
       "step": 260
     },
     {
       "epoch": 3.0,
-      "learning_rate": 0.00016,
-      "loss": 0.0237,
       "step": 270
     },
     {
       "epoch": 3.11,
-      "learning_rate": 0.0001511111111111111,
-      "loss": 0.0023,
       "step": 280
     },
     {
       "epoch": 3.22,
-      "learning_rate": 0.00014222222222222224,
-      "loss": 0.0072,
       "step": 290
     },
     {
       "epoch": 3.33,
-      "learning_rate": 0.00013333333333333334,
-      "loss": 0.001,
       "step": 300
     },
     {
       "epoch": 3.33,
-      "eval_accuracy": 0.8888888888888888,
-      "eval_loss": 0.5975281000137329,
-      "eval_runtime": 12.7539,
-      "eval_samples_per_second": 84.68,
-      "eval_steps_per_second": 10.585,
       "step": 300
     },
     {
       "epoch": 3.44,
-      "learning_rate": 0.00012444444444444444,
-      "loss": 0.0209,
       "step": 310
     },
     {
       "epoch": 3.56,
-      "learning_rate": 0.00011555555555555555,
-      "loss": 0.0208,
       "step": 320
     },
     {
       "epoch": 3.67,
-      "learning_rate": 0.00010666666666666667,
-      "loss": 0.0064,
       "step": 330
     },
     {
       "epoch": 3.78,
-      "learning_rate": 9.777777777777778e-05,
-      "loss": 0.0011,
       "step": 340
     },
     {
       "epoch": 3.89,
-      "learning_rate": 8.888888888888889e-05,
-      "loss": 0.004,
       "step": 350
     },
     {
       "epoch": 4.0,
-      "learning_rate": 8e-05,
-      "loss": 0.0097,
       "step": 360
     },
     {
       "epoch": 4.11,
-      "learning_rate": 7.111111111111112e-05,
-      "loss": 0.0004,
       "step": 370
     },
     {
       "epoch": 4.22,
-      "learning_rate": 6.222222222222222e-05,
-      "loss": 0.0015,
       "step": 380
     },
     {
       "epoch": 4.33,
-      "learning_rate": 5.333333333333333e-05,
-      "loss": 0.0004,
       "step": 390
     },
     {
       "epoch": 4.44,
-      "learning_rate": 4.4444444444444447e-05,
-      "loss": 0.0027,
       "step": 400
     },
     {
       "epoch": 4.44,
-      "eval_accuracy": 0.9064814814814814,
-      "eval_loss": 0.5585721731185913,
-      "eval_runtime": 13.4691,
-      "eval_samples_per_second": 80.184,
-      "eval_steps_per_second": 10.023,
       "step": 400
     },
     {
       "epoch": 4.56,
-      "learning_rate": 3.555555555555556e-05,
-      "loss": 0.0003,
       "step": 410
     },
     {
       "epoch": 4.67,
-      "learning_rate": 2.6666666666666667e-05,
-      "loss": 0.0018,
       "step": 420
     },
     {
       "epoch": 4.78,
-      "learning_rate": 1.777777777777778e-05,
-      "loss": 0.0054,
       "step": 430
     },
     {
       "epoch": 4.89,
-      "learning_rate": 8.88888888888889e-06,
-      "loss": 0.0057,
       "step": 440
     },
     {
       "epoch": 5.0,
       "learning_rate": 0.0,
-      "loss": 0.0004,
       "step": 450
     },
     {
       "epoch": 5.0,
       "step": 450,
       "total_flos": 1.6739319895474176e+18,
-      "train_loss": 0.0525758553068671,
-      "train_runtime": 438.9135,
-      "train_samples_per_second": 49.212,
-      "train_steps_per_second": 1.025
     }
   ],
   "logging_steps": 10,

   "log_history": [
     {
       "epoch": 0.11,
+      "learning_rate": 0.00019555555555555556,
+      "loss": 0.0098,
       "step": 10
     },
     {
       "epoch": 0.22,
+      "learning_rate": 0.00019111111111111114,
+      "loss": 0.0428,
       "step": 20
     },
     {
       "epoch": 0.33,
+      "learning_rate": 0.0001866666666666667,
+      "loss": 0.0188,
       "step": 30
     },
     {
       "epoch": 0.44,
+      "learning_rate": 0.00018222222222222224,
+      "loss": 0.0763,
       "step": 40
     },
     {
       "epoch": 0.56,
+      "learning_rate": 0.00017777777777777779,
+      "loss": 0.0098,
       "step": 50
     },
     {
       "epoch": 0.67,
+      "learning_rate": 0.00017333333333333334,
+      "loss": 0.0312,
       "step": 60
     },
     {
       "epoch": 0.78,
+      "learning_rate": 0.00016888888888888889,
+      "loss": 0.0579,
       "step": 70
     },
     {
       "epoch": 0.89,
+      "learning_rate": 0.00016444444444444444,
+      "loss": 0.024,
       "step": 80
     },
     {
       "epoch": 1.0,
+      "learning_rate": 0.00016,
+      "loss": 0.086,
       "step": 90
     },
     {
       "epoch": 1.11,
+      "learning_rate": 0.00015555555555555556,
+      "loss": 0.0009,
       "step": 100
     },
     {
       "epoch": 1.11,
+      "eval_accuracy": 0.8712962962962963,
+      "eval_loss": 0.7067815661430359,
+      "eval_runtime": 13.5776,
+      "eval_samples_per_second": 79.543,
+      "eval_steps_per_second": 9.943,
       "step": 100
     },
     {
       "epoch": 1.22,
+      "learning_rate": 0.0001511111111111111,
+      "loss": 0.0317,
       "step": 110
     },
     {
       "epoch": 1.33,
+      "learning_rate": 0.00014666666666666666,
+      "loss": 0.0388,
       "step": 120
     },
     {
       "epoch": 1.44,
+      "learning_rate": 0.00014222222222222224,
+      "loss": 0.0213,
       "step": 130
     },
     {
       "epoch": 1.56,
+      "learning_rate": 0.0001377777777777778,
+      "loss": 0.0258,
       "step": 140
     },
     {
       "epoch": 1.67,
+      "learning_rate": 0.00013333333333333334,
+      "loss": 0.0206,
       "step": 150
     },
     {
       "epoch": 1.78,
+      "learning_rate": 0.00012888888888888892,
+      "loss": 0.0481,
       "step": 160
     },
     {
       "epoch": 1.89,
+      "learning_rate": 0.00012444444444444444,
+      "loss": 0.0115,
       "step": 170
     },
     {
       "epoch": 2.0,
+      "learning_rate": 0.00012,
+      "loss": 0.015,
       "step": 180
     },
     {
       "epoch": 2.11,
+      "learning_rate": 0.00011555555555555555,
+      "loss": 0.0517,
       "step": 190
     },
     {
       "epoch": 2.22,
+      "learning_rate": 0.00011111111111111112,
+      "loss": 0.0039,
       "step": 200
     },
     {
       "epoch": 2.22,
+      "eval_accuracy": 0.899074074074074,
+      "eval_loss": 0.6390542387962341,
+      "eval_runtime": 12.7742,
+      "eval_samples_per_second": 84.545,
+      "eval_steps_per_second": 10.568,
       "step": 200
     },
     {
       "epoch": 2.33,
+      "learning_rate": 0.00010666666666666667,
+      "loss": 0.0066,
       "step": 210
     },
     {
       "epoch": 2.44,
+      "learning_rate": 0.00010222222222222222,
+      "loss": 0.002,
       "step": 220
     },
     {
       "epoch": 2.56,
+      "learning_rate": 9.777777777777778e-05,
+      "loss": 0.001,
       "step": 230
     },
     {
       "epoch": 2.67,
+      "learning_rate": 9.333333333333334e-05,
+      "loss": 0.0042,
       "step": 240
     },
     {
       "epoch": 2.78,
+      "learning_rate": 8.888888888888889e-05,
+      "loss": 0.004,
       "step": 250
     },
     {
       "epoch": 2.89,
+      "learning_rate": 8.444444444444444e-05,
+      "loss": 0.0018,
       "step": 260
     },
     {
       "epoch": 3.0,
+      "learning_rate": 8e-05,
+      "loss": 0.0019,
       "step": 270
     },
     {
       "epoch": 3.11,
+      "learning_rate": 7.555555555555556e-05,
+      "loss": 0.0002,
       "step": 280
     },
     {
       "epoch": 3.22,
+      "learning_rate": 7.111111111111112e-05,
+      "loss": 0.0002,
       "step": 290
     },
     {
       "epoch": 3.33,
+      "learning_rate": 6.666666666666667e-05,
+      "loss": 0.0014,
       "step": 300
     },
     {
       "epoch": 3.33,
+      "eval_accuracy": 0.9055555555555556,
+      "eval_loss": 0.5535524487495422,
+      "eval_runtime": 12.7035,
+      "eval_samples_per_second": 85.016,
+      "eval_steps_per_second": 10.627,
       "step": 300
     },
     {
       "epoch": 3.44,
+      "learning_rate": 6.222222222222222e-05,
+      "loss": 0.0037,
       "step": 310
     },
     {
       "epoch": 3.56,
+      "learning_rate": 5.7777777777777776e-05,
+      "loss": 0.0017,
       "step": 320
     },
     {
       "epoch": 3.67,
+      "learning_rate": 5.333333333333333e-05,
+      "loss": 0.0033,
       "step": 330
     },
     {
       "epoch": 3.78,
+      "learning_rate": 4.888888888888889e-05,
+      "loss": 0.0002,
       "step": 340
     },
     {
       "epoch": 3.89,
+      "learning_rate": 4.4444444444444447e-05,
+      "loss": 0.0043,
       "step": 350
     },
     {
       "epoch": 4.0,
+      "learning_rate": 4e-05,
+      "loss": 0.0002,
       "step": 360
     },
     {
       "epoch": 4.11,
+      "learning_rate": 3.555555555555556e-05,
+      "loss": 0.0002,
       "step": 370
     },
     {
       "epoch": 4.22,
+      "learning_rate": 3.111111111111111e-05,
+      "loss": 0.0017,
       "step": 380
     },
     {
       "epoch": 4.33,
+      "learning_rate": 2.6666666666666667e-05,
+      "loss": 0.0002,
       "step": 390
     },
     {
       "epoch": 4.44,
+      "learning_rate": 2.2222222222222223e-05,
+      "loss": 0.0018,
       "step": 400
     },
     {
       "epoch": 4.44,
+      "eval_accuracy": 0.9083333333333333,
+      "eval_loss": 0.5527949333190918,
+      "eval_runtime": 12.8229,
+      "eval_samples_per_second": 84.224,
+      "eval_steps_per_second": 10.528,
       "step": 400
     },
     {
       "epoch": 4.56,
+      "learning_rate": 1.777777777777778e-05,
+      "loss": 0.0002,
       "step": 410
     },
     {
       "epoch": 4.67,
+      "learning_rate": 1.3333333333333333e-05,
+      "loss": 0.002,
       "step": 420
     },
     {
       "epoch": 4.78,
+      "learning_rate": 8.88888888888889e-06,
+      "loss": 0.0044,
       "step": 430
     },
     {
       "epoch": 4.89,
+      "learning_rate": 4.444444444444445e-06,
+      "loss": 0.0032,
       "step": 440
     },
     {
       "epoch": 5.0,
       "learning_rate": 0.0,
+      "loss": 0.0002,
       "step": 450
     },
     {
       "epoch": 5.0,
       "step": 450,
       "total_flos": 1.6739319895474176e+18,
+      "train_loss": 0.015028678889438096,
+      "train_runtime": 430.7019,
+      "train_samples_per_second": 50.151,
+      "train_steps_per_second": 1.045
     }
   ],
   "logging_steps": 10,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:90907e3dd7aecdcf75b1b49998b4f34ff366531748788590ec538a0a00479ea7
 size 4536

 version https://git-lfs.github.com/spec/v1
+oid sha256:b2f84633d96f461c6cad6bc6d2052b12d6fc4b45d0640428f182e9d3e3a67b5f
 size 4536