End of training

Browse files

Files changed (5) hide show

README.md +1 -1
all_results.json +10 -10
eval_results.json +6 -6
train_results.json +5 -5
trainer_state.json +128 -92

README.md CHANGED Viewed

@@ -17,7 +17,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [microsoft/beit-base-patch16-224](https://huggingface.co/microsoft/beit-base-patch16-224) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0675
 - Accuracy: 0.9843
 ## Model description

 This model is a fine-tuned version of [microsoft/beit-base-patch16-224](https://huggingface.co/microsoft/beit-base-patch16-224) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0739
 - Accuracy: 0.9843
 ## Model description

all_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
-    "epoch": 7.47,
-    "eval_accuracy": 1.0,
-    "eval_loss": 0.015091076493263245,
-    "eval_runtime": 12.3295,
-    "eval_samples_per_second": 8.516,
-    "eval_steps_per_second": 0.324,
-    "train_loss": 0.4356716935123716,
-    "train_runtime": 2360.1881,
-    "train_samples_per_second": 3.183,
-    "train_steps_per_second": 0.024
 }

 {
+    "epoch": 7.7,
+    "eval_accuracy": 0.9842931937172775,
+    "eval_loss": 0.07386188954114914,
+    "eval_runtime": 26.1219,
+    "eval_samples_per_second": 7.312,
+    "eval_steps_per_second": 0.23,
+    "train_loss": 0.5548124955250666,
+    "train_runtime": 4572.4853,
+    "train_samples_per_second": 3.004,
+    "train_steps_per_second": 0.023
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 7.47,
-    "eval_accuracy": 1.0,
-    "eval_loss": 0.015091076493263245,
-    "eval_runtime": 12.3295,
-    "eval_samples_per_second": 8.516,
-    "eval_steps_per_second": 0.324
 }

 {
+    "epoch": 7.7,
+    "eval_accuracy": 0.9842931937172775,
+    "eval_loss": 0.07386188954114914,
+    "eval_runtime": 26.1219,
+    "eval_samples_per_second": 7.312,
+    "eval_steps_per_second": 0.23
 }

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
-    "epoch": 7.47,
-    "train_loss": 0.4356716935123716,
-    "train_runtime": 2360.1881,
-    "train_samples_per_second": 3.183,
-    "train_steps_per_second": 0.024
 }

 {
+    "epoch": 7.7,
+    "train_loss": 0.5548124955250666,
+    "train_runtime": 4572.4853,
+    "train_samples_per_second": 3.004,
+    "train_steps_per_second": 0.023
 }

trainer_state.json CHANGED Viewed

@@ -1,142 +1,178 @@
 {
-  "best_metric": 1.0,
-  "best_model_checkpoint": "model/checkpoint-30",
-  "epoch": 7.466666666666667,
   "eval_steps": 500,
-  "global_step": 56,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.93,
-      "eval_accuracy": 0.6190476190476191,
-      "eval_loss": 0.5468170046806335,
-      "eval_runtime": 12.9206,
-      "eval_samples_per_second": 8.127,
-      "eval_steps_per_second": 0.31,
-      "step": 7
     },
     {
-      "epoch": 1.07,
-      "learning_rate": 0.00048,
-      "loss": 1.0237,
-      "step": 8
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.9619047619047619,
-      "eval_loss": 0.11131703853607178,
-      "eval_runtime": 12.3741,
-      "eval_samples_per_second": 8.485,
-      "eval_steps_per_second": 0.323,
-      "step": 15
     },
     {
-      "epoch": 2.13,
-      "learning_rate": 0.0004,
-      "loss": 0.5329,
-      "step": 16
     },
     {
-      "epoch": 2.93,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.046230871230363846,
-      "eval_runtime": 12.3758,
-      "eval_samples_per_second": 8.484,
-      "eval_steps_per_second": 0.323,
-      "step": 22
     },
     {
-      "epoch": 3.2,
-      "learning_rate": 0.00032,
-      "loss": 0.335,
-      "step": 24
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.015091076493263245,
-      "eval_runtime": 12.4003,
-      "eval_samples_per_second": 8.468,
-      "eval_steps_per_second": 0.323,
-      "step": 30
     },
     {
-      "epoch": 4.27,
-      "learning_rate": 0.00024,
-      "loss": 0.3359,
-      "step": 32
     },
     {
-      "epoch": 4.93,
-      "eval_accuracy": 0.9428571428571428,
-      "eval_loss": 0.1429169476032257,
-      "eval_runtime": 12.3608,
-      "eval_samples_per_second": 8.495,
-      "eval_steps_per_second": 0.324,
-      "step": 37
     },
     {
       "epoch": 5.33,
-      "learning_rate": 0.00016,
-      "loss": 0.2794,
-      "step": 40
     },
     {
       "epoch": 6.0,
-      "eval_accuracy": 0.9619047619047619,
-      "eval_loss": 0.060580089688301086,
-      "eval_runtime": 12.4196,
-      "eval_samples_per_second": 8.454,
-      "eval_steps_per_second": 0.322,
-      "step": 45
     },
     {
-      "epoch": 6.4,
-      "learning_rate": 8e-05,
-      "loss": 0.2937,
-      "step": 48
     },
     {
-      "epoch": 6.93,
-      "eval_accuracy": 0.9904761904761905,
-      "eval_loss": 0.01593722589313984,
-      "eval_runtime": 12.3709,
-      "eval_samples_per_second": 8.488,
-      "eval_steps_per_second": 0.323,
-      "step": 52
     },
     {
-      "epoch": 7.47,
       "learning_rate": 0.0,
-      "loss": 0.249,
-      "step": 56
     },
     {
-      "epoch": 7.47,
-      "eval_accuracy": 0.9904761904761905,
-      "eval_loss": 0.01840730383992195,
-      "eval_runtime": 12.4229,
-      "eval_samples_per_second": 8.452,
-      "eval_steps_per_second": 0.322,
-      "step": 56
     },
     {
-      "epoch": 7.47,
-      "step": 56,
-      "total_flos": 5.438387167052636e+17,
-      "train_loss": 0.4356716935123716,
-      "train_runtime": 2360.1881,
-      "train_samples_per_second": 3.183,
-      "train_steps_per_second": 0.024
     }
   ],
   "logging_steps": 8,
-  "max_steps": 56,
   "num_train_epochs": 8,
   "save_steps": 500,
-  "total_flos": 5.438387167052636e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.9842931937172775,
+  "best_model_checkpoint": "model/checkpoint-94",
+  "epoch": 7.703703703703704,
   "eval_steps": 500,
+  "global_step": 104,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.59,
+      "learning_rate": 0.00036363636363636367,
+      "loss": 1.0999,
+      "step": 8
     },
     {
+      "epoch": 0.96,
+      "eval_accuracy": 0.643979057591623,
+      "eval_loss": 0.7986512780189514,
+      "eval_runtime": 28.581,
+      "eval_samples_per_second": 6.683,
+      "eval_steps_per_second": 0.21,
+      "step": 13
+    },
+    {
+      "epoch": 1.19,
+      "learning_rate": 0.0004731182795698925,
+      "loss": 1.0029,
+      "step": 16
+    },
+    {
+      "epoch": 1.78,
+      "learning_rate": 0.00043010752688172043,
+      "loss": 0.6342,
+      "step": 24
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.9424083769633508,
+      "eval_loss": 0.24137574434280396,
+      "eval_runtime": 26.3088,
+      "eval_samples_per_second": 7.26,
+      "eval_steps_per_second": 0.228,
+      "step": 27
     },
     {
+      "epoch": 2.37,
+      "learning_rate": 0.0003870967741935484,
+      "loss": 0.5732,
+      "step": 32
     },
     {
+      "epoch": 2.96,
+      "learning_rate": 0.0003440860215053764,
+      "loss": 0.4882,
+      "step": 40
     },
     {
+      "epoch": 2.96,
+      "eval_accuracy": 0.9633507853403142,
+      "eval_loss": 0.16461053490638733,
+      "eval_runtime": 26.318,
+      "eval_samples_per_second": 7.257,
+      "eval_steps_per_second": 0.228,
+      "step": 40
+    },
+    {
+      "epoch": 3.56,
+      "learning_rate": 0.0003010752688172043,
+      "loss": 0.463,
+      "step": 48
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.9424083769633508,
+      "eval_loss": 0.25284695625305176,
+      "eval_runtime": 26.2832,
+      "eval_samples_per_second": 7.267,
+      "eval_steps_per_second": 0.228,
+      "step": 54
     },
     {
+      "epoch": 4.15,
+      "learning_rate": 0.00025806451612903227,
+      "loss": 0.4286,
+      "step": 56
     },
     {
+      "epoch": 4.74,
+      "learning_rate": 0.00021505376344086021,
+      "loss": 0.4609,
+      "step": 64
+    },
+    {
+      "epoch": 4.96,
+      "eval_accuracy": 0.9790575916230366,
+      "eval_loss": 0.11301162838935852,
+      "eval_runtime": 26.3727,
+      "eval_samples_per_second": 7.242,
+      "eval_steps_per_second": 0.228,
+      "step": 67
     },
     {
       "epoch": 5.33,
+      "learning_rate": 0.0001720430107526882,
+      "loss": 0.4636,
+      "step": 72
+    },
+    {
+      "epoch": 5.93,
+      "learning_rate": 0.00012903225806451613,
+      "loss": 0.4251,
+      "step": 80
     },
     {
       "epoch": 6.0,
+      "eval_accuracy": 0.9633507853403142,
+      "eval_loss": 0.13039104640483856,
+      "eval_runtime": 26.3002,
+      "eval_samples_per_second": 7.262,
+      "eval_steps_per_second": 0.228,
+      "step": 81
     },
     {
+      "epoch": 6.52,
+      "learning_rate": 8.60215053763441e-05,
+      "loss": 0.3802,
+      "step": 88
     },
     {
+      "epoch": 6.96,
+      "eval_accuracy": 0.9842931937172775,
+      "eval_loss": 0.07386188954114914,
+      "eval_runtime": 26.267,
+      "eval_samples_per_second": 7.271,
+      "eval_steps_per_second": 0.228,
+      "step": 94
     },
     {
+      "epoch": 7.11,
+      "learning_rate": 4.301075268817205e-05,
+      "loss": 0.378,
+      "step": 96
+    },
+    {
+      "epoch": 7.7,
       "learning_rate": 0.0,
+      "loss": 0.4147,
+      "step": 104
     },
     {
+      "epoch": 7.7,
+      "eval_accuracy": 0.9842931937172775,
+      "eval_loss": 0.06754852086305618,
+      "eval_runtime": 26.3749,
+      "eval_samples_per_second": 7.242,
+      "eval_steps_per_second": 0.227,
+      "step": 104
     },
     {
+      "epoch": 7.7,
+      "step": 104,
+      "total_flos": 1.0251773186064077e+18,
+      "train_loss": 0.5548124955250666,
+      "train_runtime": 4572.4853,
+      "train_samples_per_second": 3.004,
+      "train_steps_per_second": 0.023
     }
   ],
   "logging_steps": 8,
+  "max_steps": 104,
   "num_train_epochs": 8,
   "save_steps": 500,
+  "total_flos": 1.0251773186064077e+18,
   "trial_name": null,
   "trial_params": null
 }