Model save

Browse files

Files changed (9) hide show

README.md +8 -8
all_results.json +9 -9
eval_results.json +6 -5
model.safetensors +1 -1
runs/Dec15_03-02-53_d2a76fcee09b/events.out.tfevents.1702611081.d2a76fcee09b.2614.15 +3 -0
runs/Dec15_03-35-22_d2a76fcee09b/events.out.tfevents.1702611334.d2a76fcee09b.2614.16 +3 -0
train_results.json +4 -4
trainer_state.json +113 -113
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -22,7 +22,7 @@ model-index:
     metrics:
     - name: Accuracy
       type: accuracy
-      value: 0.9064814814814814
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -32,8 +32,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.5586
-- Accuracy: 0.9065
 ## Model description
@@ -52,7 +52,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.0004
 - train_batch_size: 48
 - eval_batch_size: 8
 - seed: 42
@@ -65,10 +65,10 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
-| 0.1059        | 1.11  | 100  | 0.6933          | 0.8546   |
-| 0.02          | 2.22  | 200  | 0.6565          | 0.875    |
-| 0.001         | 3.33  | 300  | 0.5975          | 0.8889   |
-| 0.0027        | 4.44  | 400  | 0.5586          | 0.9065   |
 ### Framework versions

     metrics:
     - name: Accuracy
       type: accuracy
+      value: 0.9083333333333333
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.5528
+- Accuracy: 0.9083
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 0.0002
 - train_batch_size: 48
 - eval_batch_size: 8
 - seed: 42
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
+| 0.0009        | 1.11  | 100  | 0.7068          | 0.8713   |
+| 0.0039        | 2.22  | 200  | 0.6391          | 0.8991   |
+| 0.0014        | 3.33  | 300  | 0.5536          | 0.9056   |
+| 0.0018        | 4.44  | 400  | 0.5528          | 0.9083   |
 ### Framework versions

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
     "epoch": 5.0,
-    "eval_accuracy": 0.9027777777777778,
-    "eval_loss": 0.6732606887817383,
-    "eval_runtime": 14.1816,
-    "eval_samples_per_second": 76.155,
-    "eval_steps_per_second": 9.519,
     "total_flos": 1.6739319895474176e+18,
-    "train_loss": 0.010621037363954302,
-    "train_runtime": 432.9698,
-    "train_samples_per_second": 49.888,
-    "train_steps_per_second": 1.039
 }

 {
     "epoch": 5.0,
+    "eval_accuracy": 0.9083333333333333,
+    "eval_loss": 0.5385243892669678,
+    "eval_runtime": 15.071,
+    "eval_samples_per_second": 71.661,
+    "eval_steps_per_second": 8.958,
     "total_flos": 1.6739319895474176e+18,
+    "train_loss": 0.0525758553068671,
+    "train_runtime": 438.9135,
+    "train_samples_per_second": 49.212,
+    "train_steps_per_second": 1.025
 }

eval_results.json CHANGED Viewed

@@ -1,7 +1,8 @@
 {
-    "eval_accuracy": 0.9027777777777778,
-    "eval_loss": 0.6732606887817383,
-    "eval_runtime": 14.1816,
-    "eval_samples_per_second": 76.155,
-    "eval_steps_per_second": 9.519
 }

 {
+    "epoch": 5.0,
+    "eval_accuracy": 0.9083333333333333,
+    "eval_loss": 0.5385243892669678,
+    "eval_runtime": 15.071,
+    "eval_samples_per_second": 71.661,
+    "eval_steps_per_second": 8.958
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:021f71eca530feb146cad3a37b54e808b8a1bbc86397fc15b6ea6aec6b507761
 size 343245508

 version https://git-lfs.github.com/spec/v1
+oid sha256:52ffdef6ed6dcc0e0387cfae75079af794dfdaa5c63cfb4f5f306726b6a1fae6
 size 343245508

runs/Dec15_03-02-53_d2a76fcee09b/events.out.tfevents.1702611081.d2a76fcee09b.2614.15 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2af05a7cf92021fbd406d0f7dddab3e60b9e1c64631c0c33790f4f3e5141a567
+size 411

runs/Dec15_03-35-22_d2a76fcee09b/events.out.tfevents.1702611334.d2a76fcee09b.2614.16 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f1b4de43294b46273904e7af79435043816d23b4d002d19bd1c1b902ed167e4b
+size 13189

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 5.0,
     "total_flos": 1.6739319895474176e+18,
-    "train_loss": 0.010621037363954302,
-    "train_runtime": 432.9698,
-    "train_samples_per_second": 49.888,
-    "train_steps_per_second": 1.039
 }

 {
     "epoch": 5.0,
     "total_flos": 1.6739319895474176e+18,
+    "train_loss": 0.0525758553068671,
+    "train_runtime": 438.9135,
+    "train_samples_per_second": 49.212,
+    "train_steps_per_second": 1.025
 }

trainer_state.json CHANGED Viewed

@@ -10,318 +10,318 @@
   "log_history": [
     {
       "epoch": 0.11,
-      "learning_rate": 0.00014666666666666664,
-      "loss": 0.0009,
       "step": 10
     },
     {
       "epoch": 0.22,
-      "learning_rate": 0.00014333333333333334,
-      "loss": 0.0419,
       "step": 20
     },
     {
       "epoch": 0.33,
-      "learning_rate": 0.00014,
-      "loss": 0.0832,
       "step": 30
     },
     {
       "epoch": 0.44,
-      "learning_rate": 0.00013666666666666666,
-      "loss": 0.0619,
       "step": 40
     },
     {
       "epoch": 0.56,
-      "learning_rate": 0.0001333333333333333,
-      "loss": 0.0023,
       "step": 50
     },
     {
       "epoch": 0.67,
-      "learning_rate": 0.00013,
-      "loss": 0.0057,
       "step": 60
     },
     {
       "epoch": 0.78,
-      "learning_rate": 0.00012666666666666666,
-      "loss": 0.0184,
       "step": 70
     },
     {
       "epoch": 0.89,
-      "learning_rate": 0.0001233333333333333,
-      "loss": 0.0331,
       "step": 80
     },
     {
       "epoch": 1.0,
-      "learning_rate": 0.00011999999999999999,
-      "loss": 0.0038,
       "step": 90
     },
     {
       "epoch": 1.11,
-      "learning_rate": 0.00011666666666666665,
-      "loss": 0.0011,
       "step": 100
     },
     {
       "epoch": 1.11,
-      "eval_accuracy": 0.8842592592592593,
-      "eval_loss": 0.8055844306945801,
-      "eval_runtime": 12.7548,
-      "eval_samples_per_second": 84.674,
-      "eval_steps_per_second": 10.584,
       "step": 100
     },
     {
       "epoch": 1.22,
-      "learning_rate": 0.00011333333333333331,
-      "loss": 0.0092,
       "step": 110
     },
     {
       "epoch": 1.33,
-      "learning_rate": 0.00010999999999999998,
-      "loss": 0.011,
       "step": 120
     },
     {
       "epoch": 1.44,
-      "learning_rate": 0.00010666666666666667,
-      "loss": 0.0039,
       "step": 130
     },
     {
       "epoch": 1.56,
-      "learning_rate": 0.00010333333333333333,
-      "loss": 0.0289,
       "step": 140
     },
     {
       "epoch": 1.67,
-      "learning_rate": 9.999999999999999e-05,
-      "loss": 0.0204,
       "step": 150
     },
     {
       "epoch": 1.78,
-      "learning_rate": 9.666666666666667e-05,
-      "loss": 0.0024,
       "step": 160
     },
     {
       "epoch": 1.89,
-      "learning_rate": 9.333333333333333e-05,
-      "loss": 0.0471,
       "step": 170
     },
     {
       "epoch": 2.0,
-      "learning_rate": 8.999999999999999e-05,
-      "loss": 0.0247,
       "step": 180
     },
     {
       "epoch": 2.11,
-      "learning_rate": 8.666666666666665e-05,
-      "loss": 0.0016,
       "step": 190
     },
     {
       "epoch": 2.22,
-      "learning_rate": 8.333333333333333e-05,
-      "loss": 0.0063,
       "step": 200
     },
     {
       "epoch": 2.22,
-      "eval_accuracy": 0.8925925925925926,
-      "eval_loss": 0.7672075629234314,
-      "eval_runtime": 13.3931,
-      "eval_samples_per_second": 80.639,
-      "eval_steps_per_second": 10.08,
       "step": 200
     },
     {
       "epoch": 2.33,
-      "learning_rate": 7.999999999999999e-05,
-      "loss": 0.0004,
       "step": 210
     },
     {
       "epoch": 2.44,
-      "learning_rate": 7.666666666666666e-05,
-      "loss": 0.0009,
       "step": 220
     },
     {
       "epoch": 2.56,
-      "learning_rate": 7.333333333333332e-05,
-      "loss": 0.0003,
       "step": 230
     },
     {
       "epoch": 2.67,
-      "learning_rate": 7e-05,
-      "loss": 0.0122,
       "step": 240
     },
     {
       "epoch": 2.78,
-      "learning_rate": 6.666666666666666e-05,
-      "loss": 0.0182,
       "step": 250
     },
     {
       "epoch": 2.89,
-      "learning_rate": 6.333333333333333e-05,
-      "loss": 0.0015,
       "step": 260
     },
     {
       "epoch": 3.0,
-      "learning_rate": 5.9999999999999995e-05,
-      "loss": 0.0041,
       "step": 270
     },
     {
       "epoch": 3.11,
-      "learning_rate": 5.666666666666666e-05,
-      "loss": 0.0002,
       "step": 280
     },
     {
       "epoch": 3.22,
-      "learning_rate": 5.333333333333333e-05,
-      "loss": 0.0002,
       "step": 290
     },
     {
       "epoch": 3.33,
-      "learning_rate": 4.9999999999999996e-05,
-      "loss": 0.0016,
       "step": 300
     },
     {
       "epoch": 3.33,
-      "eval_accuracy": 0.9037037037037037,
-      "eval_loss": 0.6811866164207458,
-      "eval_runtime": 12.8153,
-      "eval_samples_per_second": 84.274,
-      "eval_steps_per_second": 10.534,
       "step": 300
     },
     {
       "epoch": 3.44,
-      "learning_rate": 4.6666666666666665e-05,
-      "loss": 0.0033,
       "step": 310
     },
     {
       "epoch": 3.56,
-      "learning_rate": 4.333333333333333e-05,
-      "loss": 0.0008,
       "step": 320
     },
     {
       "epoch": 3.67,
-      "learning_rate": 3.9999999999999996e-05,
-      "loss": 0.003,
       "step": 330
     },
     {
       "epoch": 3.78,
-      "learning_rate": 3.666666666666666e-05,
-      "loss": 0.0002,
       "step": 340
     },
     {
       "epoch": 3.89,
-      "learning_rate": 3.333333333333333e-05,
-      "loss": 0.0095,
       "step": 350
     },
     {
       "epoch": 4.0,
-      "learning_rate": 2.9999999999999997e-05,
-      "loss": 0.0002,
       "step": 360
     },
     {
       "epoch": 4.11,
-      "learning_rate": 2.6666666666666667e-05,
-      "loss": 0.0001,
       "step": 370
     },
     {
       "epoch": 4.22,
-      "learning_rate": 2.3333333333333332e-05,
-      "loss": 0.0016,
       "step": 380
     },
     {
       "epoch": 4.33,
-      "learning_rate": 1.9999999999999998e-05,
-      "loss": 0.0002,
       "step": 390
     },
     {
       "epoch": 4.44,
-      "learning_rate": 1.6666666666666664e-05,
-      "loss": 0.0017,
       "step": 400
     },
     {
       "epoch": 4.44,
-      "eval_accuracy": 0.9046296296296297,
-      "eval_loss": 0.6721389293670654,
-      "eval_runtime": 12.3755,
-      "eval_samples_per_second": 87.269,
-      "eval_steps_per_second": 10.909,
       "step": 400
     },
     {
       "epoch": 4.56,
-      "learning_rate": 1.3333333333333333e-05,
-      "loss": 0.0002,
       "step": 410
     },
     {
       "epoch": 4.67,
-      "learning_rate": 9.999999999999999e-06,
-      "loss": 0.0025,
       "step": 420
     },
     {
       "epoch": 4.78,
-      "learning_rate": 6.666666666666667e-06,
-      "loss": 0.004,
       "step": 430
     },
     {
       "epoch": 4.89,
-      "learning_rate": 3.3333333333333333e-06,
-      "loss": 0.0031,
       "step": 440
     },
     {
       "epoch": 5.0,
       "learning_rate": 0.0,
-      "loss": 0.0001,
       "step": 450
     },
     {
       "epoch": 5.0,
       "step": 450,
       "total_flos": 1.6739319895474176e+18,
-      "train_loss": 0.010621037363954302,
-      "train_runtime": 432.9698,
-      "train_samples_per_second": 49.888,
-      "train_steps_per_second": 1.039
     }
   ],
   "logging_steps": 10,

   "log_history": [
     {
       "epoch": 0.11,
+      "learning_rate": 0.0003911111111111111,
+      "loss": 0.0127,
       "step": 10
     },
     {
       "epoch": 0.22,
+      "learning_rate": 0.0003822222222222223,
+      "loss": 0.1644,
       "step": 20
     },
     {
       "epoch": 0.33,
+      "learning_rate": 0.0003733333333333334,
+      "loss": 0.2691,
       "step": 30
     },
     {
       "epoch": 0.44,
+      "learning_rate": 0.00036444444444444447,
+      "loss": 0.2196,
       "step": 40
     },
     {
       "epoch": 0.56,
+      "learning_rate": 0.00035555555555555557,
+      "loss": 0.1119,
       "step": 50
     },
     {
       "epoch": 0.67,
+      "learning_rate": 0.00034666666666666667,
+      "loss": 0.1708,
       "step": 60
     },
     {
       "epoch": 0.78,
+      "learning_rate": 0.00033777777777777777,
+      "loss": 0.2104,
       "step": 70
     },
     {
       "epoch": 0.89,
+      "learning_rate": 0.00032888888888888887,
+      "loss": 0.1343,
       "step": 80
     },
     {
       "epoch": 1.0,
+      "learning_rate": 0.00032,
+      "loss": 0.1185,
       "step": 90
     },
     {
       "epoch": 1.11,
+      "learning_rate": 0.0003111111111111111,
+      "loss": 0.1059,
       "step": 100
     },
     {
       "epoch": 1.11,
+      "eval_accuracy": 0.8546296296296296,
+      "eval_loss": 0.693325936794281,
+      "eval_runtime": 12.9043,
+      "eval_samples_per_second": 83.693,
+      "eval_steps_per_second": 10.462,
       "step": 100
     },
     {
       "epoch": 1.22,
+      "learning_rate": 0.0003022222222222222,
+      "loss": 0.0944,
       "step": 110
     },
     {
       "epoch": 1.33,
+      "learning_rate": 0.0002933333333333333,
+      "loss": 0.1009,
       "step": 120
     },
     {
       "epoch": 1.44,
+      "learning_rate": 0.0002844444444444445,
+      "loss": 0.0579,
       "step": 130
     },
     {
       "epoch": 1.56,
+      "learning_rate": 0.0002755555555555556,
+      "loss": 0.093,
       "step": 140
     },
     {
       "epoch": 1.67,
+      "learning_rate": 0.0002666666666666667,
+      "loss": 0.054,
       "step": 150
     },
     {
       "epoch": 1.78,
+      "learning_rate": 0.00025777777777777783,
+      "loss": 0.0366,
       "step": 160
     },
     {
       "epoch": 1.89,
+      "learning_rate": 0.0002488888888888889,
+      "loss": 0.027,
       "step": 170
     },
     {
       "epoch": 2.0,
+      "learning_rate": 0.00024,
+      "loss": 0.0369,
       "step": 180
     },
     {
       "epoch": 2.11,
+      "learning_rate": 0.0002311111111111111,
+      "loss": 0.0354,
       "step": 190
     },
     {
       "epoch": 2.22,
+      "learning_rate": 0.00022222222222222223,
+      "loss": 0.02,
       "step": 200
     },
     {
       "epoch": 2.22,
+      "eval_accuracy": 0.875,
+      "eval_loss": 0.656458854675293,
+      "eval_runtime": 12.7588,
+      "eval_samples_per_second": 84.647,
+      "eval_steps_per_second": 10.581,
       "step": 200
     },
     {
       "epoch": 2.33,
+      "learning_rate": 0.00021333333333333333,
+      "loss": 0.0236,
       "step": 210
     },
     {
       "epoch": 2.44,
+      "learning_rate": 0.00020444444444444443,
+      "loss": 0.032,
       "step": 220
     },
     {
       "epoch": 2.56,
+      "learning_rate": 0.00019555555555555556,
+      "loss": 0.0369,
       "step": 230
     },
     {
       "epoch": 2.67,
+      "learning_rate": 0.0001866666666666667,
+      "loss": 0.0339,
       "step": 240
     },
     {
       "epoch": 2.78,
+      "learning_rate": 0.00017777777777777779,
+      "loss": 0.0207,
       "step": 250
     },
     {
       "epoch": 2.89,
+      "learning_rate": 0.00016888888888888889,
+      "loss": 0.0291,
       "step": 260
     },
     {
       "epoch": 3.0,
+      "learning_rate": 0.00016,
+      "loss": 0.0237,
       "step": 270
     },
     {
       "epoch": 3.11,
+      "learning_rate": 0.0001511111111111111,
+      "loss": 0.0023,
       "step": 280
     },
     {
       "epoch": 3.22,
+      "learning_rate": 0.00014222222222222224,
+      "loss": 0.0072,
       "step": 290
     },
     {
       "epoch": 3.33,
+      "learning_rate": 0.00013333333333333334,
+      "loss": 0.001,
       "step": 300
     },
     {
       "epoch": 3.33,
+      "eval_accuracy": 0.8888888888888888,
+      "eval_loss": 0.5975281000137329,
+      "eval_runtime": 12.7539,
+      "eval_samples_per_second": 84.68,
+      "eval_steps_per_second": 10.585,
       "step": 300
     },
     {
       "epoch": 3.44,
+      "learning_rate": 0.00012444444444444444,
+      "loss": 0.0209,
       "step": 310
     },
     {
       "epoch": 3.56,
+      "learning_rate": 0.00011555555555555555,
+      "loss": 0.0208,
       "step": 320
     },
     {
       "epoch": 3.67,
+      "learning_rate": 0.00010666666666666667,
+      "loss": 0.0064,
       "step": 330
     },
     {
       "epoch": 3.78,
+      "learning_rate": 9.777777777777778e-05,
+      "loss": 0.0011,
       "step": 340
     },
     {
       "epoch": 3.89,
+      "learning_rate": 8.888888888888889e-05,
+      "loss": 0.004,
       "step": 350
     },
     {
       "epoch": 4.0,
+      "learning_rate": 8e-05,
+      "loss": 0.0097,
       "step": 360
     },
     {
       "epoch": 4.11,
+      "learning_rate": 7.111111111111112e-05,
+      "loss": 0.0004,
       "step": 370
     },
     {
       "epoch": 4.22,
+      "learning_rate": 6.222222222222222e-05,
+      "loss": 0.0015,
       "step": 380
     },
     {
       "epoch": 4.33,
+      "learning_rate": 5.333333333333333e-05,
+      "loss": 0.0004,
       "step": 390
     },
     {
       "epoch": 4.44,
+      "learning_rate": 4.4444444444444447e-05,
+      "loss": 0.0027,
       "step": 400
     },
     {
       "epoch": 4.44,
+      "eval_accuracy": 0.9064814814814814,
+      "eval_loss": 0.5585721731185913,
+      "eval_runtime": 13.4691,
+      "eval_samples_per_second": 80.184,
+      "eval_steps_per_second": 10.023,
       "step": 400
     },
     {
       "epoch": 4.56,
+      "learning_rate": 3.555555555555556e-05,
+      "loss": 0.0003,
       "step": 410
     },
     {
       "epoch": 4.67,
+      "learning_rate": 2.6666666666666667e-05,
+      "loss": 0.0018,
       "step": 420
     },
     {
       "epoch": 4.78,
+      "learning_rate": 1.777777777777778e-05,
+      "loss": 0.0054,
       "step": 430
     },
     {
       "epoch": 4.89,
+      "learning_rate": 8.88888888888889e-06,
+      "loss": 0.0057,
       "step": 440
     },
     {
       "epoch": 5.0,
       "learning_rate": 0.0,
+      "loss": 0.0004,
       "step": 450
     },
     {
       "epoch": 5.0,
       "step": 450,
       "total_flos": 1.6739319895474176e+18,
+      "train_loss": 0.0525758553068671,
+      "train_runtime": 438.9135,
+      "train_samples_per_second": 49.212,
+      "train_steps_per_second": 1.025
     }
   ],
   "logging_steps": 10,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9cf957047e4ef28d8cbe1f0f8e02d27ba9ae96d94d13ab6aff2f23772cf24642
 size 4536

 version https://git-lfs.github.com/spec/v1
+oid sha256:90907e3dd7aecdcf75b1b49998b4f34ff366531748788590ec538a0a00479ea7
 size 4536