Model save

Browse files

Files changed (9) hide show

README.md +8 -5
all_results.json +11 -11
eval_results.json +6 -6
model.safetensors +1 -1
runs/Nov30_23-24-53_6c26dad0aabb/events.out.tfevents.1701388197.6c26dad0aabb.7066.4 +3 -0
runs/Nov30_23-50-18_6c26dad0aabb/events.out.tfevents.1701388227.6c26dad0aabb.7066.5 +3 -0
train_results.json +6 -6
trainer_state.json +161 -104
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -32,7 +32,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0870
 - Accuracy: 0.9774
 ## Model description
@@ -58,16 +58,19 @@ The following hyperparameters were used during training:
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 10
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
-| 0.1606        | 2.94  | 100  | 0.1829          | 0.9511   |
-| 0.1895        | 5.88  | 200  | 0.1441          | 0.9662   |
-| 0.0423        | 8.82  | 300  | 0.0870          | 0.9774   |
 ### Framework versions

 This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.1073
 - Accuracy: 0.9774
 ## Model description
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 20
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
+| 0.0673        | 2.94  | 100  | 0.1144          | 0.9699   |
+| 0.0639        | 5.88  | 200  | 0.1431          | 0.9549   |
+| 0.0491        | 8.82  | 300  | 0.2439          | 0.9436   |
+| 0.0532        | 11.76 | 400  | 0.1389          | 0.9624   |
+| 0.0636        | 14.71 | 500  | 0.1537          | 0.9624   |
+| 0.0493        | 17.65 | 600  | 0.1073          | 0.9774   |
 ### Framework versions

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
-    "epoch": 4.0,
-    "eval_accuracy": 0.9548872180451128,
-    "eval_loss": 0.18233025074005127,
-    "eval_runtime": 2.6375,
-    "eval_samples_per_second": 100.853,
-    "eval_steps_per_second": 12.891,
-    "total_flos": 3.292007238315049e+17,
-    "train_loss": 0.5091555158593761,
-    "train_runtime": 958.3438,
-    "train_samples_per_second": 4.433,
-    "train_steps_per_second": 0.28
 }

 {
+    "epoch": 10.0,
+    "eval_accuracy": 0.9774436090225563,
+    "eval_loss": 0.08701933920383453,
+    "eval_runtime": 6.074,
+    "eval_samples_per_second": 43.794,
+    "eval_steps_per_second": 5.598,
+    "total_flos": 8.230018095787622e+17,
+    "train_loss": 0.1465345554492053,
+    "train_runtime": 221.0307,
+    "train_samples_per_second": 48.048,
+    "train_steps_per_second": 1.538
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 4.0,
-    "eval_accuracy": 0.9548872180451128,
-    "eval_loss": 0.18233025074005127,
-    "eval_runtime": 2.6375,
-    "eval_samples_per_second": 100.853,
-    "eval_steps_per_second": 12.891
 }

 {
+    "epoch": 10.0,
+    "eval_accuracy": 0.9774436090225563,
+    "eval_loss": 0.08701933920383453,
+    "eval_runtime": 6.074,
+    "eval_samples_per_second": 43.794,
+    "eval_steps_per_second": 5.598
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:86d8fbbe5587bcb92891682aa722012947d3377ee2016b310819dd2600bc17ef
 size 343239356

 version https://git-lfs.github.com/spec/v1
+oid sha256:411fb8baf76f74b477a876b3be53846a6c2c51f9277cb00a81542425c237112f
 size 343239356

runs/Nov30_23-24-53_6c26dad0aabb/events.out.tfevents.1701388197.6c26dad0aabb.7066.4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:06a65913484bc16a9200120c328bc649062568aeac6e2385df8965cf3585a7ee
+size 411

runs/Nov30_23-50-18_6c26dad0aabb/events.out.tfevents.1701388227.6c26dad0aabb.7066.5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:76b8a5911036db92b1652c997605f1151504fc201444bcd1bdd0c2322b086fd9
+size 17453

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 4.0,
-    "total_flos": 3.292007238315049e+17,
-    "train_loss": 0.5091555158593761,
-    "train_runtime": 958.3438,
-    "train_samples_per_second": 4.433,
-    "train_steps_per_second": 0.28
 }

 {
+    "epoch": 10.0,
+    "total_flos": 8.230018095787622e+17,
+    "train_loss": 0.1465345554492053,
+    "train_runtime": 221.0307,
+    "train_samples_per_second": 48.048,
+    "train_steps_per_second": 1.538
 }

trainer_state.json CHANGED Viewed

@@ -1,202 +1,259 @@
 {
-  "best_metric": 0.18233025074005127,
-  "best_model_checkpoint": "finetuned-Leukemia-cell/checkpoint-200",
-  "epoch": 4.0,
   "eval_steps": 100,
-  "global_step": 268,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.15,
-      "learning_rate": 0.00019253731343283584,
-      "loss": 1.7951,
       "step": 10
     },
     {
-      "epoch": 0.3,
-      "learning_rate": 0.00018507462686567165,
-      "loss": 1.3572,
       "step": 20
     },
     {
-      "epoch": 0.45,
-      "learning_rate": 0.00017761194029850748,
-      "loss": 0.98,
       "step": 30
     },
     {
-      "epoch": 0.6,
-      "learning_rate": 0.00017014925373134328,
-      "loss": 0.9394,
       "step": 40
     },
     {
-      "epoch": 0.75,
-      "learning_rate": 0.00016268656716417911,
-      "loss": 0.7973,
       "step": 50
     },
     {
-      "epoch": 0.9,
-      "learning_rate": 0.00015522388059701495,
-      "loss": 0.8591,
       "step": 60
     },
     {
-      "epoch": 1.04,
-      "learning_rate": 0.00014776119402985075,
-      "loss": 0.6357,
       "step": 70
     },
     {
-      "epoch": 1.19,
-      "learning_rate": 0.00014029850746268658,
-      "loss": 0.6522,
       "step": 80
     },
     {
-      "epoch": 1.34,
-      "learning_rate": 0.0001328358208955224,
-      "loss": 0.495,
       "step": 90
     },
     {
-      "epoch": 1.49,
-      "learning_rate": 0.00012537313432835822,
-      "loss": 0.4862,
       "step": 100
     },
     {
-      "epoch": 1.49,
-      "eval_accuracy": 0.9172932330827067,
-      "eval_loss": 0.4092223644256592,
-      "eval_runtime": 173.193,
-      "eval_samples_per_second": 1.536,
-      "eval_steps_per_second": 0.196,
       "step": 100
     },
     {
-      "epoch": 1.64,
-      "learning_rate": 0.00011791044776119405,
-      "loss": 0.5047,
       "step": 110
     },
     {
-      "epoch": 1.79,
-      "learning_rate": 0.00011044776119402987,
-      "loss": 0.3878,
       "step": 120
     },
     {
-      "epoch": 1.94,
-      "learning_rate": 0.00010298507462686569,
-      "loss": 0.43,
       "step": 130
     },
     {
-      "epoch": 2.09,
-      "learning_rate": 9.552238805970149e-05,
-      "loss": 0.3441,
       "step": 140
     },
     {
-      "epoch": 2.24,
-      "learning_rate": 8.805970149253732e-05,
-      "loss": 0.3271,
       "step": 150
     },
     {
-      "epoch": 2.39,
-      "learning_rate": 8.059701492537314e-05,
-      "loss": 0.3415,
       "step": 160
     },
     {
-      "epoch": 2.54,
-      "learning_rate": 7.313432835820896e-05,
-      "loss": 0.293,
       "step": 170
     },
     {
-      "epoch": 2.69,
-      "learning_rate": 6.567164179104478e-05,
-      "loss": 0.2864,
       "step": 180
     },
     {
-      "epoch": 2.84,
-      "learning_rate": 5.82089552238806e-05,
-      "loss": 0.2873,
       "step": 190
     },
     {
-      "epoch": 2.99,
-      "learning_rate": 5.074626865671642e-05,
-      "loss": 0.2095,
       "step": 200
     },
     {
-      "epoch": 2.99,
-      "eval_accuracy": 0.9548872180451128,
-      "eval_loss": 0.18233025074005127,
-      "eval_runtime": 2.578,
-      "eval_samples_per_second": 103.183,
-      "eval_steps_per_second": 13.189,
       "step": 200
     },
     {
-      "epoch": 3.13,
-      "learning_rate": 4.328358208955224e-05,
-      "loss": 0.1822,
       "step": 210
     },
     {
-      "epoch": 3.28,
-      "learning_rate": 3.582089552238806e-05,
-      "loss": 0.228,
       "step": 220
     },
     {
-      "epoch": 3.43,
-      "learning_rate": 2.835820895522388e-05,
-      "loss": 0.1377,
       "step": 230
     },
     {
-      "epoch": 3.58,
-      "learning_rate": 2.0895522388059702e-05,
-      "loss": 0.2099,
       "step": 240
     },
     {
-      "epoch": 3.73,
-      "learning_rate": 1.3432835820895523e-05,
-      "loss": 0.1576,
       "step": 250
     },
     {
-      "epoch": 3.88,
-      "learning_rate": 5.970149253731343e-06,
-      "loss": 0.1394,
       "step": 260
     },
     {
-      "epoch": 4.0,
-      "step": 268,
-      "total_flos": 3.292007238315049e+17,
-      "train_loss": 0.5091555158593761,
-      "train_runtime": 958.3438,
-      "train_samples_per_second": 4.433,
-      "train_steps_per_second": 0.28
     }
   ],
   "logging_steps": 10,
-  "max_steps": 268,
-  "num_train_epochs": 4,
   "save_steps": 100,
-  "total_flos": 3.292007238315049e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.08701933920383453,
+  "best_model_checkpoint": "finetuned-Leukemia-cell/checkpoint-300",
+  "epoch": 10.0,
   "eval_steps": 100,
+  "global_step": 340,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.29,
+      "learning_rate": 0.00019411764705882354,
+      "loss": 0.5837,
       "step": 10
     },
     {
+      "epoch": 0.59,
+      "learning_rate": 0.00018823529411764707,
+      "loss": 0.2956,
       "step": 20
     },
     {
+      "epoch": 0.88,
+      "learning_rate": 0.0001823529411764706,
+      "loss": 0.279,
       "step": 30
     },
     {
+      "epoch": 1.18,
+      "learning_rate": 0.00017647058823529413,
+      "loss": 0.1566,
       "step": 40
     },
     {
+      "epoch": 1.47,
+      "learning_rate": 0.00017058823529411766,
+      "loss": 0.1042,
       "step": 50
     },
     {
+      "epoch": 1.76,
+      "learning_rate": 0.0001647058823529412,
+      "loss": 0.176,
       "step": 60
     },
     {
+      "epoch": 2.06,
+      "learning_rate": 0.0001588235294117647,
+      "loss": 0.1231,
       "step": 70
     },
     {
+      "epoch": 2.35,
+      "learning_rate": 0.00015294117647058822,
+      "loss": 0.0952,
       "step": 80
     },
     {
+      "epoch": 2.65,
+      "learning_rate": 0.00014705882352941178,
+      "loss": 0.1003,
       "step": 90
     },
     {
+      "epoch": 2.94,
+      "learning_rate": 0.0001411764705882353,
+      "loss": 0.1606,
       "step": 100
     },
     {
+      "epoch": 2.94,
+      "eval_accuracy": 0.9511278195488722,
+      "eval_loss": 0.18294382095336914,
+      "eval_runtime": 2.8739,
+      "eval_samples_per_second": 92.556,
+      "eval_steps_per_second": 11.83,
       "step": 100
     },
     {
+      "epoch": 3.24,
+      "learning_rate": 0.00013529411764705884,
+      "loss": 0.2204,
       "step": 110
     },
     {
+      "epoch": 3.53,
+      "learning_rate": 0.00012941176470588237,
+      "loss": 0.2845,
       "step": 120
     },
     {
+      "epoch": 3.82,
+      "learning_rate": 0.0001235294117647059,
+      "loss": 0.2104,
       "step": 130
     },
     {
+      "epoch": 4.12,
+      "learning_rate": 0.00011764705882352942,
+      "loss": 0.2029,
       "step": 140
     },
     {
+      "epoch": 4.41,
+      "learning_rate": 0.00011176470588235294,
+      "loss": 0.1105,
       "step": 150
     },
     {
+      "epoch": 4.71,
+      "learning_rate": 0.00010588235294117647,
+      "loss": 0.177,
       "step": 160
     },
     {
+      "epoch": 5.0,
+      "learning_rate": 0.0001,
+      "loss": 0.1881,
       "step": 170
     },
     {
+      "epoch": 5.29,
+      "learning_rate": 9.411764705882353e-05,
+      "loss": 0.1445,
       "step": 180
     },
     {
+      "epoch": 5.59,
+      "learning_rate": 8.823529411764706e-05,
+      "loss": 0.0891,
       "step": 190
     },
     {
+      "epoch": 5.88,
+      "learning_rate": 8.23529411764706e-05,
+      "loss": 0.1895,
       "step": 200
     },
     {
+      "epoch": 5.88,
+      "eval_accuracy": 0.9661654135338346,
+      "eval_loss": 0.14408943057060242,
+      "eval_runtime": 2.3757,
+      "eval_samples_per_second": 111.968,
+      "eval_steps_per_second": 14.312,
       "step": 200
     },
     {
+      "epoch": 6.18,
+      "learning_rate": 7.647058823529411e-05,
+      "loss": 0.1095,
       "step": 210
     },
     {
+      "epoch": 6.47,
+      "learning_rate": 7.058823529411765e-05,
+      "loss": 0.1908,
       "step": 220
     },
     {
+      "epoch": 6.76,
+      "learning_rate": 6.470588235294118e-05,
+      "loss": 0.1118,
       "step": 230
     },
     {
+      "epoch": 7.06,
+      "learning_rate": 5.882352941176471e-05,
+      "loss": 0.0461,
       "step": 240
     },
     {
+      "epoch": 7.35,
+      "learning_rate": 5.294117647058824e-05,
+      "loss": 0.1002,
       "step": 250
     },
     {
+      "epoch": 7.65,
+      "learning_rate": 4.705882352941177e-05,
+      "loss": 0.082,
       "step": 260
     },
     {
+      "epoch": 7.94,
+      "learning_rate": 4.11764705882353e-05,
+      "loss": 0.0712,
+      "step": 270
+    },
+    {
+      "epoch": 8.24,
+      "learning_rate": 3.529411764705883e-05,
+      "loss": 0.0565,
+      "step": 280
+    },
+    {
+      "epoch": 8.53,
+      "learning_rate": 2.9411764705882354e-05,
+      "loss": 0.0702,
+      "step": 290
+    },
+    {
+      "epoch": 8.82,
+      "learning_rate": 2.3529411764705884e-05,
+      "loss": 0.0423,
+      "step": 300
+    },
+    {
+      "epoch": 8.82,
+      "eval_accuracy": 0.9774436090225563,
+      "eval_loss": 0.08701933920383453,
+      "eval_runtime": 2.414,
+      "eval_samples_per_second": 110.19,
+      "eval_steps_per_second": 14.084,
+      "step": 300
+    },
+    {
+      "epoch": 9.12,
+      "learning_rate": 1.7647058823529414e-05,
+      "loss": 0.0652,
+      "step": 310
+    },
+    {
+      "epoch": 9.41,
+      "learning_rate": 1.1764705882352942e-05,
+      "loss": 0.027,
+      "step": 320
+    },
+    {
+      "epoch": 9.71,
+      "learning_rate": 5.882352941176471e-06,
+      "loss": 0.0633,
+      "step": 330
+    },
+    {
+      "epoch": 10.0,
+      "learning_rate": 0.0,
+      "loss": 0.055,
+      "step": 340
+    },
+    {
+      "epoch": 10.0,
+      "step": 340,
+      "total_flos": 8.230018095787622e+17,
+      "train_loss": 0.1465345554492053,
+      "train_runtime": 221.0307,
+      "train_samples_per_second": 48.048,
+      "train_steps_per_second": 1.538
     }
   ],
   "logging_steps": 10,
+  "max_steps": 340,
+  "num_train_epochs": 10,
   "save_steps": 100,
+  "total_flos": 8.230018095787622e+17,
   "trial_name": null,
   "trial_params": null
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:945f141fbeb29ad39b8605b232d98a21f0507a88e5e0eb935c00a2a7f5a4a921
 size 4600

 version https://git-lfs.github.com/spec/v1
+oid sha256:f0c51a9692dffa79666ee4c2a799f0ef6e3fddf95c8240e6d000dc48049d3457
 size 4600