🍻 cheers

Browse files

Files changed (6) hide show

README.md +4 -3
all_results.json +8 -8
eval_results.json +4 -4
runs/Jun10_21-44-02_39bec5d8a054/events.out.tfevents.1718056013.39bec5d8a054.1252.1 +3 -0
train_results.json +4 -4
trainer_state.json +68 -68

README.md CHANGED Viewed

@@ -2,6 +2,7 @@
 license: apache-2.0
 base_model: google/vit-base-patch16-224-in21k
 tags:
 - generated_from_trainer
 metrics:
 - accuracy
@@ -15,10 +16,10 @@ should probably proofread and complete it, then remove this comment. -->
 # vit-base-beans-demo-v7
-This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0571
-- Accuracy: 0.9850
 ## Model description

 license: apache-2.0
 base_model: google/vit-base-patch16-224-in21k
 tags:
+- image-classification
 - generated_from_trainer
 metrics:
 - accuracy
 # vit-base-beans-demo-v7
+This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on the beans dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0492
+- Accuracy: 0.9925
 ## Model description

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
     "epoch": 4.0,
     "eval_accuracy": 0.9924812030075187,
-    "eval_loss": 0.042201049625873566,
-    "eval_runtime": 1.5136,
-    "eval_samples_per_second": 87.868,
-    "eval_steps_per_second": 11.231,
     "total_flos": 3.205097416476426e+17,
-    "train_loss": 0.11964335679434814,
-    "train_runtime": 100.8137,
-    "train_samples_per_second": 41.026,
-    "train_steps_per_second": 2.579
 }

 {
     "epoch": 4.0,
     "eval_accuracy": 0.9924812030075187,
+    "eval_loss": 0.0491877980530262,
+    "eval_runtime": 1.5785,
+    "eval_samples_per_second": 84.255,
+    "eval_steps_per_second": 10.769,
     "total_flos": 3.205097416476426e+17,
+    "train_loss": 0.12038601376116276,
+    "train_runtime": 77.0575,
+    "train_samples_per_second": 53.674,
+    "train_steps_per_second": 3.374
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 4.0,
     "eval_accuracy": 0.9924812030075187,
-    "eval_loss": 0.042201049625873566,
-    "eval_runtime": 1.5136,
-    "eval_samples_per_second": 87.868,
-    "eval_steps_per_second": 11.231
 }

 {
     "epoch": 4.0,
     "eval_accuracy": 0.9924812030075187,
+    "eval_loss": 0.0491877980530262,
+    "eval_runtime": 1.5785,
+    "eval_samples_per_second": 84.255,
+    "eval_steps_per_second": 10.769
 }

runs/Jun10_21-44-02_39bec5d8a054/events.out.tfevents.1718056013.39bec5d8a054.1252.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1f625cf02346e976e244840791cda40eda3183918bb28e0db64dbd122de4164d
+size 411

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 4.0,
     "total_flos": 3.205097416476426e+17,
-    "train_loss": 0.11964335679434814,
-    "train_runtime": 100.8137,
-    "train_samples_per_second": 41.026,
-    "train_steps_per_second": 2.579
 }

 {
     "epoch": 4.0,
     "total_flos": 3.205097416476426e+17,
+    "train_loss": 0.12038601376116276,
+    "train_runtime": 77.0575,
+    "train_samples_per_second": 53.674,
+    "train_steps_per_second": 3.374
 }

trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.042201049625873566,
-  "best_model_checkpoint": "./vit-base-beans-demo-v7/checkpoint-200",
   "epoch": 4.0,
   "eval_steps": 100,
   "global_step": 260,
@@ -10,212 +10,212 @@
   "log_history": [
     {
       "epoch": 0.15384615384615385,
-      "grad_norm": 1.7636618614196777,
       "learning_rate": 0.00019230769230769233,
-      "loss": 0.8443,
       "step": 10
     },
     {
       "epoch": 0.3076923076923077,
-      "grad_norm": 1.1493185758590698,
       "learning_rate": 0.00018461538461538463,
-      "loss": 0.3526,
       "step": 20
     },
     {
       "epoch": 0.46153846153846156,
-      "grad_norm": 0.6322227120399475,
       "learning_rate": 0.00017692307692307693,
-      "loss": 0.2377,
       "step": 30
     },
     {
       "epoch": 0.6153846153846154,
-      "grad_norm": 0.7355738282203674,
       "learning_rate": 0.00016923076923076923,
-      "loss": 0.2375,
       "step": 40
     },
     {
       "epoch": 0.7692307692307693,
-      "grad_norm": 0.3265851140022278,
       "learning_rate": 0.00016153846153846155,
-      "loss": 0.2825,
       "step": 50
     },
     {
       "epoch": 0.9230769230769231,
-      "grad_norm": 0.9981272220611572,
       "learning_rate": 0.00015384615384615385,
-      "loss": 0.2397,
       "step": 60
     },
     {
       "epoch": 1.0769230769230769,
-      "grad_norm": 3.7455718517303467,
       "learning_rate": 0.00014615384615384615,
-      "loss": 0.1233,
       "step": 70
     },
     {
       "epoch": 1.2307692307692308,
-      "grad_norm": 3.8250844478607178,
       "learning_rate": 0.00013846153846153847,
-      "loss": 0.1297,
       "step": 80
     },
     {
       "epoch": 1.3846153846153846,
-      "grad_norm": 0.28349635004997253,
       "learning_rate": 0.00013076923076923077,
-      "loss": 0.0927,
       "step": 90
     },
     {
       "epoch": 1.5384615384615383,
-      "grad_norm": 1.9211033582687378,
       "learning_rate": 0.0001230769230769231,
-      "loss": 0.0686,
       "step": 100
     },
     {
       "epoch": 1.5384615384615383,
-      "eval_accuracy": 0.9849624060150376,
-      "eval_loss": 0.07935579121112823,
-      "eval_runtime": 1.7219,
-      "eval_samples_per_second": 77.239,
-      "eval_steps_per_second": 9.873,
       "step": 100
     },
     {
       "epoch": 1.6923076923076923,
-      "grad_norm": 2.195355176925659,
       "learning_rate": 0.00011538461538461538,
-      "loss": 0.1031,
       "step": 110
     },
     {
       "epoch": 1.8461538461538463,
-      "grad_norm": 0.32399165630340576,
       "learning_rate": 0.0001076923076923077,
-      "loss": 0.1192,
       "step": 120
     },
     {
       "epoch": 2.0,
-      "grad_norm": 0.09631959348917007,
       "learning_rate": 0.0001,
-      "loss": 0.022,
       "step": 130
     },
     {
       "epoch": 2.1538461538461537,
-      "grad_norm": 0.0886223167181015,
       "learning_rate": 9.230769230769232e-05,
-      "loss": 0.0342,
       "step": 140
     },
     {
       "epoch": 2.3076923076923075,
-      "grad_norm": 0.1216232031583786,
       "learning_rate": 8.461538461538461e-05,
-      "loss": 0.0176,
       "step": 150
     },
     {
       "epoch": 2.4615384615384617,
-      "grad_norm": 0.0750468522310257,
       "learning_rate": 7.692307692307693e-05,
-      "loss": 0.0366,
       "step": 160
     },
     {
       "epoch": 2.6153846153846154,
-      "grad_norm": 0.07128575444221497,
       "learning_rate": 6.923076923076924e-05,
-      "loss": 0.0144,
       "step": 170
     },
     {
       "epoch": 2.769230769230769,
-      "grad_norm": 3.5829079151153564,
       "learning_rate": 6.153846153846155e-05,
-      "loss": 0.0536,
       "step": 180
     },
     {
       "epoch": 2.9230769230769234,
-      "grad_norm": 1.5514700412750244,
       "learning_rate": 5.384615384615385e-05,
-      "loss": 0.0146,
       "step": 190
     },
     {
       "epoch": 3.076923076923077,
-      "grad_norm": 0.061695199459791183,
       "learning_rate": 4.615384615384616e-05,
-      "loss": 0.0125,
       "step": 200
     },
     {
       "epoch": 3.076923076923077,
-      "eval_accuracy": 0.9924812030075187,
-      "eval_loss": 0.042201049625873566,
-      "eval_runtime": 1.2489,
-      "eval_samples_per_second": 106.492,
-      "eval_steps_per_second": 13.612,
       "step": 200
     },
     {
       "epoch": 3.230769230769231,
-      "grad_norm": 0.060515470802783966,
       "learning_rate": 3.846153846153846e-05,
-      "loss": 0.0124,
       "step": 210
     },
     {
       "epoch": 3.3846153846153846,
-      "grad_norm": 0.06038433685898781,
       "learning_rate": 3.0769230769230774e-05,
-      "loss": 0.0114,
       "step": 220
     },
     {
       "epoch": 3.5384615384615383,
-      "grad_norm": 0.0607147179543972,
       "learning_rate": 2.307692307692308e-05,
-      "loss": 0.0169,
       "step": 230
     },
     {
       "epoch": 3.6923076923076925,
-      "grad_norm": 0.058113083243370056,
       "learning_rate": 1.5384615384615387e-05,
-      "loss": 0.011,
       "step": 240
     },
     {
       "epoch": 3.8461538461538463,
-      "grad_norm": 0.06449621915817261,
       "learning_rate": 7.692307692307694e-06,
-      "loss": 0.0111,
       "step": 250
     },
     {
       "epoch": 4.0,
-      "grad_norm": 0.08513768017292023,
       "learning_rate": 0.0,
-      "loss": 0.0112,
       "step": 260
     },
     {
       "epoch": 4.0,
       "step": 260,
       "total_flos": 3.205097416476426e+17,
-      "train_loss": 0.11964335679434814,
-      "train_runtime": 100.8137,
-      "train_samples_per_second": 41.026,
-      "train_steps_per_second": 2.579
     }
   ],
   "logging_steps": 10,

 {
+  "best_metric": 0.0491877980530262,
+  "best_model_checkpoint": "./vit-base-beans-demo-v7/checkpoint-100",
   "epoch": 4.0,
   "eval_steps": 100,
   "global_step": 260,
   "log_history": [
     {
       "epoch": 0.15384615384615385,
+      "grad_norm": 1.6902730464935303,
       "learning_rate": 0.00019230769230769233,
+      "loss": 0.7748,
       "step": 10
     },
     {
       "epoch": 0.3076923076923077,
+      "grad_norm": 1.2790460586547852,
       "learning_rate": 0.00018461538461538463,
+      "loss": 0.2739,
       "step": 20
     },
     {
       "epoch": 0.46153846153846156,
+      "grad_norm": 0.7741395235061646,
       "learning_rate": 0.00017692307692307693,
+      "loss": 0.1927,
       "step": 30
     },
     {
       "epoch": 0.6153846153846154,
+      "grad_norm": 5.114573001861572,
       "learning_rate": 0.00016923076923076923,
+      "loss": 0.2443,
       "step": 40
     },
     {
       "epoch": 0.7692307692307693,
+      "grad_norm": 15.121728897094727,
       "learning_rate": 0.00016153846153846155,
+      "loss": 0.2038,
       "step": 50
     },
     {
       "epoch": 0.9230769230769231,
+      "grad_norm": 3.094726324081421,
       "learning_rate": 0.00015384615384615385,
+      "loss": 0.2427,
       "step": 60
     },
     {
       "epoch": 1.0769230769230769,
+      "grad_norm": 0.9401968717575073,
       "learning_rate": 0.00014615384615384615,
+      "loss": 0.179,
       "step": 70
     },
     {
       "epoch": 1.2307692307692308,
+      "grad_norm": 0.16439810395240784,
       "learning_rate": 0.00013846153846153847,
+      "loss": 0.1334,
       "step": 80
     },
     {
       "epoch": 1.3846153846153846,
+      "grad_norm": 0.1418611705303192,
       "learning_rate": 0.00013076923076923077,
+      "loss": 0.1166,
       "step": 90
     },
     {
       "epoch": 1.5384615384615383,
+      "grad_norm": 1.5957568883895874,
       "learning_rate": 0.0001230769230769231,
+      "loss": 0.0862,
       "step": 100
     },
     {
       "epoch": 1.5384615384615383,
+      "eval_accuracy": 0.9924812030075187,
+      "eval_loss": 0.0491877980530262,
+      "eval_runtime": 1.3534,
+      "eval_samples_per_second": 98.272,
+      "eval_steps_per_second": 12.561,
       "step": 100
     },
     {
       "epoch": 1.6923076923076923,
+      "grad_norm": 1.3301724195480347,
       "learning_rate": 0.00011538461538461538,
+      "loss": 0.1008,
       "step": 110
     },
     {
       "epoch": 1.8461538461538463,
+      "grad_norm": 0.32133230566978455,
       "learning_rate": 0.0001076923076923077,
+      "loss": 0.0803,
       "step": 120
     },
     {
       "epoch": 2.0,
+      "grad_norm": 0.4987194836139679,
       "learning_rate": 0.0001,
+      "loss": 0.0777,
       "step": 130
     },
     {
       "epoch": 2.1538461538461537,
+      "grad_norm": 3.434934377670288,
       "learning_rate": 9.230769230769232e-05,
+      "loss": 0.0583,
       "step": 140
     },
     {
       "epoch": 2.3076923076923075,
+      "grad_norm": 0.08973214775323868,
       "learning_rate": 8.461538461538461e-05,
+      "loss": 0.0796,
       "step": 150
     },
     {
       "epoch": 2.4615384615384617,
+      "grad_norm": 0.0839068666100502,
       "learning_rate": 7.692307692307693e-05,
+      "loss": 0.0468,
       "step": 160
     },
     {
       "epoch": 2.6153846153846154,
+      "grad_norm": 0.265321284532547,
       "learning_rate": 6.923076923076924e-05,
+      "loss": 0.0204,
       "step": 170
     },
     {
       "epoch": 2.769230769230769,
+      "grad_norm": 0.07917013019323349,
       "learning_rate": 6.153846153846155e-05,
+      "loss": 0.0646,
       "step": 180
     },
     {
       "epoch": 2.9230769230769234,
+      "grad_norm": 0.07372036576271057,
       "learning_rate": 5.384615384615385e-05,
+      "loss": 0.0452,
       "step": 190
     },
     {
       "epoch": 3.076923076923077,
+      "grad_norm": 0.0797925740480423,
       "learning_rate": 4.615384615384616e-05,
+      "loss": 0.031,
       "step": 200
     },
     {
       "epoch": 3.076923076923077,
+      "eval_accuracy": 0.9849624060150376,
+      "eval_loss": 0.0571388304233551,
+      "eval_runtime": 1.3229,
+      "eval_samples_per_second": 100.536,
+      "eval_steps_per_second": 12.85,
       "step": 200
     },
     {
       "epoch": 3.230769230769231,
+      "grad_norm": 0.08364936709403992,
       "learning_rate": 3.846153846153846e-05,
+      "loss": 0.0151,
       "step": 210
     },
     {
       "epoch": 3.3846153846153846,
+      "grad_norm": 0.0659966766834259,
       "learning_rate": 3.0769230769230774e-05,
+      "loss": 0.013,
       "step": 220
     },
     {
       "epoch": 3.5384615384615383,
+      "grad_norm": 0.06812237203121185,
       "learning_rate": 2.307692307692308e-05,
+      "loss": 0.0129,
       "step": 230
     },
     {
       "epoch": 3.6923076923076925,
+      "grad_norm": 0.06594033539295197,
       "learning_rate": 1.5384615384615387e-05,
+      "loss": 0.0123,
       "step": 240
     },
     {
       "epoch": 3.8461538461538463,
+      "grad_norm": 0.06312059611082077,
       "learning_rate": 7.692307692307694e-06,
+      "loss": 0.0123,
       "step": 250
     },
     {
       "epoch": 4.0,
+      "grad_norm": 0.0624660886824131,
       "learning_rate": 0.0,
+      "loss": 0.0121,
       "step": 260
     },
     {
       "epoch": 4.0,
       "step": 260,
       "total_flos": 3.205097416476426e+17,
+      "train_loss": 0.12038601376116276,
+      "train_runtime": 77.0575,
+      "train_samples_per_second": 53.674,
+      "train_steps_per_second": 3.374
     }
   ],
   "logging_steps": 10,