End of training

Browse files

Files changed (7) hide show

README.md +15 -4
all_results.json +6 -6
model.safetensors +1 -1
runs/Mar01_10-29-38_ca6729c6f81a/events.out.tfevents.1709288980.ca6729c6f81a.27.0 +3 -0
train_results.json +6 -6
trainer_state.json +268 -22
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -17,8 +17,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.5268
-- Accuracy: 0.7904
 ## Model description
@@ -46,13 +46,24 @@ The following hyperparameters were used during training:
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_ratio: 0.1
-- num_epochs: 1
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
-| 0.9626        | 0.99  | 61   | 0.5268          | 0.7904   |
 ### Framework versions

 This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.4840
+- Accuracy: 0.8648
 ## Model description
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_ratio: 0.1
+- num_epochs: 12
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
+| 1.3961        | 0.99  | 61   | 0.5629          | 0.7725   |
+| 0.4982        | 2.0   | 123  | 0.3991          | 0.8435   |
+| 0.3563        | 2.99  | 184  | 0.4330          | 0.8272   |
+| 0.2314        | 4.0   | 246  | 0.3969          | 0.8554   |
+| 0.1815        | 4.99  | 307  | 0.4492          | 0.8435   |
+| 0.1332        | 6.0   | 369  | 0.4474          | 0.8580   |
+| 0.0869        | 6.99  | 430  | 0.4520          | 0.8631   |
+| 0.0844        | 8.0   | 492  | 0.4469          | 0.8640   |
+| 0.0681        | 8.99  | 553  | 0.4533          | 0.8717   |
+| 0.0574        | 10.0  | 615  | 0.4952          | 0.8597   |
+| 0.0477        | 10.99 | 676  | 0.4772          | 0.8674   |
+| 0.0454        | 11.9  | 732  | 0.4840          | 0.8648   |
 ### Framework versions

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 0.99,
-    "total_flos": 6.0508456960367e+17,
-    "train_loss": 0.7793287371025711,
-    "train_runtime": 231.1327,
-    "train_samples_per_second": 33.946,
-    "train_steps_per_second": 0.264
 }

 {
+    "epoch": 11.9,
+    "total_flos": 7.238851133027512e+18,
+    "train_loss": 0.2366401759978852,
+    "train_runtime": 2240.6293,
+    "train_samples_per_second": 42.02,
+    "train_steps_per_second": 0.327
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4d73d0afb68247d0448aafb93cfffae921a45a9a659bcac2dbe2b057ca662251
 size 343239356

 version https://git-lfs.github.com/spec/v1
+oid sha256:fdb3ff87ca7808f0c4cf62a3446f5c26b1e35f88306fdf942ced906aa80be2a0
 size 343239356

runs/Mar01_10-29-38_ca6729c6f81a/events.out.tfevents.1709288980.ca6729c6f81a.27.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:47205af3a3d9a1e65bbce75aaa0bc3f746bb89ae057ad273eb57e6335958e7ea
+size 13628

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 0.99,
-    "total_flos": 6.0508456960367e+17,
-    "train_loss": 0.7793287371025711,
-    "train_runtime": 231.1327,
-    "train_samples_per_second": 33.946,
-    "train_steps_per_second": 0.264
 }

 {
+    "epoch": 11.9,
+    "total_flos": 7.238851133027512e+18,
+    "train_loss": 0.2366401759978852,
+    "train_runtime": 2240.6293,
+    "train_samples_per_second": 42.02,
+    "train_steps_per_second": 0.327
 }

trainer_state.json CHANGED Viewed

@@ -1,45 +1,291 @@
 {
-  "best_metric": 0.7904191616766467,
-  "best_model_checkpoint": "skincare-detection/checkpoint-61",
-  "epoch": 0.991869918699187,
   "eval_steps": 500,
-  "global_step": 61,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 0.52,
-      "grad_norm": 0.6144677996635437,
-      "learning_rate": 0.00010740740740740742,
-      "loss": 0.9626,
       "step": 32
     },
     {
       "epoch": 0.99,
-      "eval_accuracy": 0.7904191616766467,
-      "eval_loss": 0.5268285870552063,
-      "eval_runtime": 12.168,
-      "eval_samples_per_second": 96.072,
-      "eval_steps_per_second": 3.041,
       "step": 61
     },
     {
-      "epoch": 0.99,
-      "step": 61,
-      "total_flos": 6.0508456960367e+17,
-      "train_loss": 0.7793287371025711,
-      "train_runtime": 231.1327,
-      "train_samples_per_second": 33.946,
-      "train_steps_per_second": 0.264
     }
   ],
   "logging_steps": 32,
-  "max_steps": 61,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 1,
   "save_steps": 500,
-  "total_flos": 6.0508456960367e+17,
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 0.8716852010265184,
+  "best_model_checkpoint": "skincare-detection/checkpoint-553",
+  "epoch": 11.902439024390244,
   "eval_steps": 500,
+  "global_step": 732,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 0.52,
+      "grad_norm": 1.0143417119979858,
+      "learning_rate": 8.64864864864865e-05,
+      "loss": 1.3961,
       "step": 32
     },
     {
       "epoch": 0.99,
+      "eval_accuracy": 0.7724550898203593,
+      "eval_loss": 0.5629431009292603,
+      "eval_runtime": 12.1216,
+      "eval_samples_per_second": 96.439,
+      "eval_steps_per_second": 3.052,
       "step": 61
     },
     {
+      "epoch": 1.04,
+      "grad_norm": 0.6657726764678955,
+      "learning_rate": 0.000172972972972973,
+      "loss": 0.6454,
+      "step": 64
+    },
+    {
+      "epoch": 1.56,
+      "grad_norm": 0.6649633049964905,
+      "learning_rate": 0.0001933130699088146,
+      "loss": 0.4982,
+      "step": 96
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.8434559452523525,
+      "eval_loss": 0.3991105854511261,
+      "eval_runtime": 12.1709,
+      "eval_samples_per_second": 96.049,
+      "eval_steps_per_second": 3.04,
+      "step": 123
+    },
+    {
+      "epoch": 2.08,
+      "grad_norm": 0.7564620971679688,
+      "learning_rate": 0.00018358662613981763,
+      "loss": 0.4536,
+      "step": 128
+    },
+    {
+      "epoch": 2.6,
+      "grad_norm": 0.6977857351303101,
+      "learning_rate": 0.00017386018237082067,
+      "loss": 0.3563,
+      "step": 160
+    },
+    {
+      "epoch": 2.99,
+      "eval_accuracy": 0.8272027373823782,
+      "eval_loss": 0.43296942114830017,
+      "eval_runtime": 12.3181,
+      "eval_samples_per_second": 94.901,
+      "eval_steps_per_second": 3.004,
+      "step": 184
+    },
+    {
+      "epoch": 3.12,
+      "grad_norm": 0.7642468214035034,
+      "learning_rate": 0.0001641337386018237,
+      "loss": 0.3169,
+      "step": 192
+    },
+    {
+      "epoch": 3.64,
+      "grad_norm": 0.9004422426223755,
+      "learning_rate": 0.00015440729483282676,
+      "loss": 0.2314,
+      "step": 224
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.8554319931565441,
+      "eval_loss": 0.39688870310783386,
+      "eval_runtime": 12.3055,
+      "eval_samples_per_second": 94.998,
+      "eval_steps_per_second": 3.007,
+      "step": 246
+    },
+    {
+      "epoch": 4.16,
+      "grad_norm": 0.9273125529289246,
+      "learning_rate": 0.0001446808510638298,
+      "loss": 0.2055,
+      "step": 256
+    },
+    {
+      "epoch": 4.68,
+      "grad_norm": 0.6541422009468079,
+      "learning_rate": 0.00013495440729483285,
+      "loss": 0.1815,
+      "step": 288
+    },
+    {
+      "epoch": 4.99,
+      "eval_accuracy": 0.8434559452523525,
+      "eval_loss": 0.44923701882362366,
+      "eval_runtime": 12.4125,
+      "eval_samples_per_second": 94.179,
+      "eval_steps_per_second": 2.981,
+      "step": 307
+    },
+    {
+      "epoch": 5.2,
+      "grad_norm": 1.0498323440551758,
+      "learning_rate": 0.00012522796352583589,
+      "loss": 0.1514,
+      "step": 320
+    },
+    {
+      "epoch": 5.72,
+      "grad_norm": 1.087367057800293,
+      "learning_rate": 0.00011550151975683892,
+      "loss": 0.1332,
+      "step": 352
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.8579982891360137,
+      "eval_loss": 0.44741156697273254,
+      "eval_runtime": 12.1735,
+      "eval_samples_per_second": 96.029,
+      "eval_steps_per_second": 3.039,
+      "step": 369
+    },
+    {
+      "epoch": 6.24,
+      "grad_norm": 0.9595869183540344,
+      "learning_rate": 0.00010577507598784195,
+      "loss": 0.1201,
+      "step": 384
+    },
+    {
+      "epoch": 6.76,
+      "grad_norm": 0.39300984144210815,
+      "learning_rate": 9.6048632218845e-05,
+      "loss": 0.0869,
+      "step": 416
+    },
+    {
+      "epoch": 6.99,
+      "eval_accuracy": 0.863130881094953,
+      "eval_loss": 0.45202794671058655,
+      "eval_runtime": 12.4693,
+      "eval_samples_per_second": 93.75,
+      "eval_steps_per_second": 2.967,
+      "step": 430
+    },
+    {
+      "epoch": 7.28,
+      "grad_norm": 0.9669052362442017,
+      "learning_rate": 8.632218844984803e-05,
+      "loss": 0.0991,
+      "step": 448
+    },
+    {
+      "epoch": 7.8,
+      "grad_norm": 0.8003025650978088,
+      "learning_rate": 7.659574468085106e-05,
+      "loss": 0.0844,
+      "step": 480
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.8639863130881095,
+      "eval_loss": 0.44686540961265564,
+      "eval_runtime": 12.1322,
+      "eval_samples_per_second": 96.355,
+      "eval_steps_per_second": 3.05,
+      "step": 492
+    },
+    {
+      "epoch": 8.33,
+      "grad_norm": 0.3683207333087921,
+      "learning_rate": 6.686930091185411e-05,
+      "loss": 0.0811,
+      "step": 512
+    },
+    {
+      "epoch": 8.85,
+      "grad_norm": 0.6750203371047974,
+      "learning_rate": 5.714285714285714e-05,
+      "loss": 0.0681,
+      "step": 544
+    },
+    {
+      "epoch": 8.99,
+      "eval_accuracy": 0.8716852010265184,
+      "eval_loss": 0.45333394408226013,
+      "eval_runtime": 12.2392,
+      "eval_samples_per_second": 95.513,
+      "eval_steps_per_second": 3.023,
+      "step": 553
+    },
+    {
+      "epoch": 9.37,
+      "grad_norm": 0.48275861144065857,
+      "learning_rate": 4.741641337386019e-05,
+      "loss": 0.0635,
+      "step": 576
+    },
+    {
+      "epoch": 9.89,
+      "grad_norm": 0.8461657762527466,
+      "learning_rate": 3.768996960486322e-05,
+      "loss": 0.0574,
+      "step": 608
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.8597091531223268,
+      "eval_loss": 0.4952048361301422,
+      "eval_runtime": 12.278,
+      "eval_samples_per_second": 95.211,
+      "eval_steps_per_second": 3.014,
+      "step": 615
+    },
+    {
+      "epoch": 10.41,
+      "grad_norm": 0.2595687806606293,
+      "learning_rate": 2.796352583586626e-05,
+      "loss": 0.0518,
+      "step": 640
+    },
+    {
+      "epoch": 10.93,
+      "grad_norm": 0.39481160044670105,
+      "learning_rate": 1.82370820668693e-05,
+      "loss": 0.0477,
+      "step": 672
+    },
+    {
+      "epoch": 10.99,
+      "eval_accuracy": 0.8674080410607357,
+      "eval_loss": 0.4772116541862488,
+      "eval_runtime": 12.2102,
+      "eval_samples_per_second": 95.74,
+      "eval_steps_per_second": 3.03,
+      "step": 676
+    },
+    {
+      "epoch": 11.45,
+      "grad_norm": 0.43194687366485596,
+      "learning_rate": 8.510638297872341e-06,
+      "loss": 0.0454,
+      "step": 704
+    },
+    {
+      "epoch": 11.9,
+      "eval_accuracy": 0.864841745081266,
+      "eval_loss": 0.48397254943847656,
+      "eval_runtime": 12.6433,
+      "eval_samples_per_second": 92.46,
+      "eval_steps_per_second": 2.926,
+      "step": 732
+    },
+    {
+      "epoch": 11.9,
+      "step": 732,
+      "total_flos": 7.238851133027512e+18,
+      "train_loss": 0.2366401759978852,
+      "train_runtime": 2240.6293,
+      "train_samples_per_second": 42.02,
+      "train_steps_per_second": 0.327
     }
   ],
   "logging_steps": 32,
+  "max_steps": 732,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 12,
   "save_steps": 500,
+  "total_flos": 7.238851133027512e+18,
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:eeb5e1cdd191226dda034f610f4983376ba030389a2ad9ca754d87bf2dbdfc3c
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:dd196ff8c32cf67e6b93a873f443390233b9329421c2b02bd8fff51e4392f3e2
 size 4920