End of training

Browse files

Files changed (5) hide show

all_results.json +11 -11
eval_results.json +6 -6
runs/Mar29_05-51-50_01165a1d2f58/events.out.tfevents.1711692701.01165a1d2f58.7243.1 +3 -0
train_results.json +6 -6
trainer_state.json +123 -294

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
-    "epoch": 3.0,
-    "eval_accuracy": 0.9840740740740741,
-    "eval_loss": 0.0557386614382267,
-    "eval_runtime": 18.4525,
-    "eval_samples_per_second": 146.322,
-    "eval_steps_per_second": 4.606,
-    "total_flos": 1.8124066505760768e+18,
-    "train_loss": 0.31778242818096225,
-    "train_runtime": 1131.972,
-    "train_samples_per_second": 64.401,
-    "train_steps_per_second": 0.504
 }

 {
+    "epoch": 2.98,
+    "eval_accuracy": 0.9358974358974359,
+    "eval_loss": 0.17716573178768158,
+    "eval_runtime": 9.4517,
+    "eval_samples_per_second": 148.545,
+    "eval_steps_per_second": 4.655,
+    "total_flos": 9.625811808320225e+17,
+    "train_loss": 0.22732183539948494,
+    "train_runtime": 623.8374,
+    "train_samples_per_second": 60.737,
+    "train_steps_per_second": 0.471
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 3.0,
-    "eval_accuracy": 0.9840740740740741,
-    "eval_loss": 0.0557386614382267,
-    "eval_runtime": 18.4525,
-    "eval_samples_per_second": 146.322,
-    "eval_steps_per_second": 4.606
 }

 {
+    "epoch": 2.98,
+    "eval_accuracy": 0.9358974358974359,
+    "eval_loss": 0.17716573178768158,
+    "eval_runtime": 9.4517,
+    "eval_samples_per_second": 148.545,
+    "eval_steps_per_second": 4.655
 }

runs/Mar29_05-51-50_01165a1d2f58/events.out.tfevents.1711692701.01165a1d2f58.7243.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:580dead3d1a166c4a86a2a3ccc6e213927b25746a4f91d48a52423ea572b09ec
+size 411

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 3.0,
-    "total_flos": 1.8124066505760768e+18,
-    "train_loss": 0.31778242818096225,
-    "train_runtime": 1131.972,
-    "train_samples_per_second": 64.401,
-    "train_steps_per_second": 0.504
 }

 {
+    "epoch": 2.98,
+    "total_flos": 9.625811808320225e+17,
+    "train_loss": 0.22732183539948494,
+    "train_runtime": 623.8374,
+    "train_samples_per_second": 60.737,
+    "train_steps_per_second": 0.471
 }

trainer_state.json CHANGED Viewed

@@ -1,397 +1,226 @@
 {
-  "best_metric": 0.9840740740740741,
-  "best_model_checkpoint": "swin-tiny-patch4-window7-224-finetuned-eurosat/checkpoint-570",
-  "epoch": 3.0,
-  "eval_steps": 500,
-  "global_step": 570,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.05,
-      "learning_rate": 8.771929824561403e-06,
-      "loss": 2.215,
       "step": 10
     },
     {
-      "epoch": 0.11,
-      "learning_rate": 1.7543859649122806e-05,
-      "loss": 1.9939,
       "step": 20
     },
     {
-      "epoch": 0.16,
-      "learning_rate": 2.6315789473684212e-05,
-      "loss": 1.529,
       "step": 30
     },
     {
-      "epoch": 0.21,
-      "learning_rate": 3.508771929824561e-05,
-      "loss": 0.9676,
       "step": 40
     },
     {
-      "epoch": 0.26,
-      "learning_rate": 4.3859649122807014e-05,
-      "loss": 0.593,
       "step": 50
     },
     {
-      "epoch": 0.32,
-      "learning_rate": 4.970760233918128e-05,
-      "loss": 0.4515,
       "step": 60
     },
     {
-      "epoch": 0.37,
-      "learning_rate": 4.8732943469785574e-05,
-      "loss": 0.4242,
       "step": 70
     },
     {
-      "epoch": 0.42,
-      "learning_rate": 4.7758284600389865e-05,
-      "loss": 0.3578,
       "step": 80
     },
     {
-      "epoch": 0.47,
-      "learning_rate": 4.678362573099415e-05,
-      "loss": 0.3588,
       "step": 90
     },
     {
-      "epoch": 0.53,
-      "learning_rate": 4.580896686159844e-05,
-      "loss": 0.3177,
       "step": 100
     },
     {
-      "epoch": 0.58,
-      "learning_rate": 4.483430799220273e-05,
-      "loss": 0.3047,
       "step": 110
     },
     {
-      "epoch": 0.63,
-      "learning_rate": 4.3859649122807014e-05,
-      "loss": 0.2788,
       "step": 120
     },
     {
-      "epoch": 0.68,
-      "learning_rate": 4.2884990253411305e-05,
-      "loss": 0.2536,
       "step": 130
     },
     {
-      "epoch": 0.74,
-      "learning_rate": 4.1910331384015596e-05,
-      "loss": 0.2755,
       "step": 140
     },
     {
-      "epoch": 0.79,
-      "learning_rate": 4.093567251461988e-05,
-      "loss": 0.2463,
       "step": 150
     },
     {
-      "epoch": 0.84,
-      "learning_rate": 3.996101364522417e-05,
-      "loss": 0.2462,
       "step": 160
     },
     {
-      "epoch": 0.89,
-      "learning_rate": 3.898635477582846e-05,
-      "loss": 0.2736,
       "step": 170
     },
     {
-      "epoch": 0.95,
-      "learning_rate": 3.8011695906432746e-05,
-      "loss": 0.2336,
       "step": 180
     },
     {
-      "epoch": 1.0,
-      "learning_rate": 3.7037037037037037e-05,
-      "loss": 0.2386,
       "step": 190
     },
     {
-      "epoch": 1.0,
-      "eval_accuracy": 0.9692592592592593,
-      "eval_loss": 0.0964987725019455,
-      "eval_runtime": 17.4648,
-      "eval_samples_per_second": 154.597,
-      "eval_steps_per_second": 4.867,
-      "step": 190
     },
     {
-      "epoch": 1.05,
-      "learning_rate": 3.606237816764133e-05,
-      "loss": 0.2334,
       "step": 200
     },
     {
-      "epoch": 1.11,
-      "learning_rate": 3.508771929824561e-05,
-      "loss": 0.2451,
       "step": 210
     },
     {
-      "epoch": 1.16,
-      "learning_rate": 3.41130604288499e-05,
-      "loss": 0.219,
       "step": 220
     },
     {
-      "epoch": 1.21,
-      "learning_rate": 3.313840155945419e-05,
-      "loss": 0.2097,
       "step": 230
     },
     {
-      "epoch": 1.26,
-      "learning_rate": 3.216374269005848e-05,
-      "loss": 0.2495,
       "step": 240
     },
     {
-      "epoch": 1.32,
-      "learning_rate": 3.118908382066277e-05,
-      "loss": 0.2297,
       "step": 250
     },
     {
-      "epoch": 1.37,
-      "learning_rate": 3.0214424951267055e-05,
-      "loss": 0.2307,
       "step": 260
     },
     {
-      "epoch": 1.42,
-      "learning_rate": 2.9239766081871346e-05,
-      "loss": 0.24,
       "step": 270
     },
     {
-      "epoch": 1.47,
-      "learning_rate": 2.8265107212475634e-05,
-      "loss": 0.2043,
       "step": 280
     },
     {
-      "epoch": 1.53,
-      "learning_rate": 2.729044834307992e-05,
-      "loss": 0.161,
       "step": 290
     },
     {
-      "epoch": 1.58,
-      "learning_rate": 2.6315789473684212e-05,
-      "loss": 0.194,
-      "step": 300
-    },
-    {
-      "epoch": 1.63,
-      "learning_rate": 2.53411306042885e-05,
-      "loss": 0.1762,
-      "step": 310
-    },
-    {
-      "epoch": 1.68,
-      "learning_rate": 2.4366471734892787e-05,
-      "loss": 0.1482,
-      "step": 320
-    },
-    {
-      "epoch": 1.74,
-      "learning_rate": 2.3391812865497074e-05,
-      "loss": 0.1565,
-      "step": 330
-    },
-    {
-      "epoch": 1.79,
-      "learning_rate": 2.2417153996101365e-05,
-      "loss": 0.1722,
-      "step": 340
-    },
-    {
-      "epoch": 1.84,
-      "learning_rate": 2.1442495126705653e-05,
-      "loss": 0.1737,
-      "step": 350
-    },
-    {
-      "epoch": 1.89,
-      "learning_rate": 2.046783625730994e-05,
-      "loss": 0.1442,
-      "step": 360
-    },
-    {
-      "epoch": 1.95,
-      "learning_rate": 1.949317738791423e-05,
-      "loss": 0.1678,
-      "step": 370
-    },
-    {
-      "epoch": 2.0,
-      "learning_rate": 1.8518518518518518e-05,
-      "loss": 0.1616,
-      "step": 380
-    },
-    {
-      "epoch": 2.0,
-      "eval_accuracy": 0.9740740740740741,
-      "eval_loss": 0.0751405879855156,
-      "eval_runtime": 16.9062,
-      "eval_samples_per_second": 159.704,
-      "eval_steps_per_second": 5.028,
-      "step": 380
     },
     {
-      "epoch": 2.05,
-      "learning_rate": 1.7543859649122806e-05,
-      "loss": 0.1901,
-      "step": 390
-    },
-    {
-      "epoch": 2.11,
-      "learning_rate": 1.6569200779727097e-05,
-      "loss": 0.1432,
-      "step": 400
-    },
-    {
-      "epoch": 2.16,
-      "learning_rate": 1.5594541910331384e-05,
-      "loss": 0.1707,
-      "step": 410
-    },
-    {
-      "epoch": 2.21,
-      "learning_rate": 1.4619883040935673e-05,
-      "loss": 0.1698,
-      "step": 420
-    },
-    {
-      "epoch": 2.26,
-      "learning_rate": 1.364522417153996e-05,
-      "loss": 0.1359,
-      "step": 430
-    },
-    {
-      "epoch": 2.32,
-      "learning_rate": 1.267056530214425e-05,
-      "loss": 0.177,
-      "step": 440
-    },
-    {
-      "epoch": 2.37,
-      "learning_rate": 1.1695906432748537e-05,
-      "loss": 0.1201,
-      "step": 450
-    },
-    {
-      "epoch": 2.42,
-      "learning_rate": 1.0721247563352826e-05,
-      "loss": 0.1487,
-      "step": 460
-    },
-    {
-      "epoch": 2.47,
-      "learning_rate": 9.746588693957115e-06,
-      "loss": 0.1459,
-      "step": 470
-    },
-    {
-      "epoch": 2.53,
-      "learning_rate": 8.771929824561403e-06,
-      "loss": 0.1591,
-      "step": 480
-    },
-    {
-      "epoch": 2.58,
-      "learning_rate": 7.797270955165692e-06,
-      "loss": 0.1647,
-      "step": 490
-    },
-    {
-      "epoch": 2.63,
-      "learning_rate": 6.82261208576998e-06,
-      "loss": 0.1611,
-      "step": 500
-    },
-    {
-      "epoch": 2.68,
-      "learning_rate": 5.8479532163742686e-06,
-      "loss": 0.1318,
-      "step": 510
-    },
-    {
-      "epoch": 2.74,
-      "learning_rate": 4.873294346978558e-06,
-      "loss": 0.1241,
-      "step": 520
-    },
-    {
-      "epoch": 2.79,
-      "learning_rate": 3.898635477582846e-06,
-      "loss": 0.152,
-      "step": 530
-    },
-    {
-      "epoch": 2.84,
-      "learning_rate": 2.9239766081871343e-06,
-      "loss": 0.1573,
-      "step": 540
-    },
-    {
-      "epoch": 2.89,
-      "learning_rate": 1.949317738791423e-06,
-      "loss": 0.1152,
-      "step": 550
-    },
-    {
-      "epoch": 2.95,
-      "learning_rate": 9.746588693957115e-07,
-      "loss": 0.1235,
-      "step": 560
-    },
-    {
-      "epoch": 3.0,
-      "learning_rate": 0.0,
-      "loss": 0.1469,
-      "step": 570
-    },
-    {
-      "epoch": 3.0,
-      "eval_accuracy": 0.9840740740740741,
-      "eval_loss": 0.0557386614382267,
-      "eval_runtime": 16.9406,
-      "eval_samples_per_second": 159.38,
-      "eval_steps_per_second": 5.018,
-      "step": 570
-    },
-    {
-      "epoch": 3.0,
-      "step": 570,
-      "total_flos": 1.8124066505760768e+18,
-      "train_loss": 0.31778242818096225,
-      "train_runtime": 1131.972,
-      "train_samples_per_second": 64.401,
-      "train_steps_per_second": 0.504
     }
   ],
-  "logging_steps": 10,
-  "max_steps": 570,
   "num_train_epochs": 3,
-  "save_steps": 500,
-  "total_flos": 1.8124066505760768e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.9358974358974359,
+  "best_model_checkpoint": "swin-tiny-patch4-window7-224-finetuned-eurosat/checkpoint-197",
+  "epoch": 2.9772151898734176,
+  "global_step": 294,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.1,
+      "learning_rate": 3.522727272727273e-05,
+      "loss": 0.2741,
       "step": 10
     },
     {
+      "epoch": 0.2,
+      "learning_rate": 3.3333333333333335e-05,
+      "loss": 0.2632,
       "step": 20
     },
     {
+      "epoch": 0.3,
+      "learning_rate": 3.143939393939394e-05,
+      "loss": 0.2745,
       "step": 30
     },
     {
+      "epoch": 0.41,
+      "learning_rate": 2.954545454545455e-05,
+      "loss": 0.2581,
       "step": 40
     },
     {
+      "epoch": 0.51,
+      "learning_rate": 2.7651515151515152e-05,
+      "loss": 0.2809,
       "step": 50
     },
     {
+      "epoch": 0.61,
+      "learning_rate": 2.575757575757576e-05,
+      "loss": 0.223,
       "step": 60
     },
     {
+      "epoch": 0.71,
+      "learning_rate": 2.3863636363636365e-05,
+      "loss": 0.2812,
       "step": 70
     },
     {
+      "epoch": 0.81,
+      "learning_rate": 2.1969696969696972e-05,
+      "loss": 0.2188,
       "step": 80
     },
     {
+      "epoch": 0.91,
+      "learning_rate": 2.0075757575757575e-05,
+      "loss": 0.2447,
       "step": 90
     },
     {
+      "epoch": 0.99,
+      "eval_accuracy": 0.9323361823361823,
+      "eval_loss": 0.18062111735343933,
+      "eval_runtime": 9.6659,
+      "eval_samples_per_second": 145.253,
+      "eval_steps_per_second": 4.552,
+      "step": 98
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 1.8181818181818182e-05,
+      "loss": 0.2251,
       "step": 100
     },
     {
+      "epoch": 1.11,
+      "learning_rate": 1.628787878787879e-05,
+      "loss": 0.2101,
       "step": 110
     },
     {
+      "epoch": 1.22,
+      "learning_rate": 1.4393939393939396e-05,
+      "loss": 0.225,
       "step": 120
     },
     {
+      "epoch": 1.32,
+      "learning_rate": 1.25e-05,
+      "loss": 0.248,
       "step": 130
     },
     {
+      "epoch": 1.42,
+      "learning_rate": 1.0606060606060607e-05,
+      "loss": 0.2189,
       "step": 140
     },
     {
+      "epoch": 1.52,
+      "learning_rate": 8.712121212121212e-06,
+      "loss": 0.2285,
       "step": 150
     },
     {
+      "epoch": 1.62,
+      "learning_rate": 6.818181818181818e-06,
+      "loss": 0.2232,
       "step": 160
     },
     {
+      "epoch": 1.72,
+      "learning_rate": 4.924242424242424e-06,
+      "loss": 0.2191,
       "step": 170
     },
     {
+      "epoch": 1.82,
+      "learning_rate": 3.0303030303030305e-06,
+      "loss": 0.2231,
       "step": 180
     },
     {
+      "epoch": 1.92,
+      "learning_rate": 1.1363636363636364e-06,
+      "loss": 0.1986,
       "step": 190
     },
     {
+      "epoch": 1.99,
+      "eval_accuracy": 0.9358974358974359,
+      "eval_loss": 0.17716573178768158,
+      "eval_runtime": 9.3711,
+      "eval_samples_per_second": 149.823,
+      "eval_steps_per_second": 4.695,
+      "step": 197
     },
     {
+      "epoch": 2.03,
+      "learning_rate": 0.0,
+      "loss": 0.2088,
       "step": 200
     },
     {
+      "epoch": 2.13,
+      "learning_rate": 0.0,
+      "loss": 0.2201,
       "step": 210
     },
     {
+      "epoch": 2.23,
+      "learning_rate": 0.0,
+      "loss": 0.1851,
       "step": 220
     },
     {
+      "epoch": 2.33,
+      "learning_rate": 0.0,
+      "loss": 0.2126,
       "step": 230
     },
     {
+      "epoch": 2.43,
+      "learning_rate": 0.0,
+      "loss": 0.2031,
       "step": 240
     },
     {
+      "epoch": 2.53,
+      "learning_rate": 0.0,
+      "loss": 0.2218,
       "step": 250
     },
     {
+      "epoch": 2.63,
+      "learning_rate": 0.0,
+      "loss": 0.2018,
       "step": 260
     },
     {
+      "epoch": 2.73,
+      "learning_rate": 0.0,
+      "loss": 0.2096,
       "step": 270
     },
     {
+      "epoch": 2.84,
+      "learning_rate": 0.0,
+      "loss": 0.2128,
       "step": 280
     },
     {
+      "epoch": 2.94,
+      "learning_rate": 0.0,
+      "loss": 0.1933,
       "step": 290
     },
     {
+      "epoch": 2.98,
+      "eval_accuracy": 0.9358974358974359,
+      "eval_loss": 0.17716573178768158,
+      "eval_runtime": 9.0385,
+      "eval_samples_per_second": 155.336,
+      "eval_steps_per_second": 4.868,
+      "step": 294
     },
     {
+      "epoch": 2.98,
+      "step": 294,
+      "total_flos": 9.625811808320225e+17,
+      "train_loss": 0.22732183539948494,
+      "train_runtime": 623.8374,
+      "train_samples_per_second": 60.737,
+      "train_steps_per_second": 0.471
     }
   ],
+  "max_steps": 294,
   "num_train_epochs": 3,
+  "total_flos": 9.625811808320225e+17,
   "trial_name": null,
   "trial_params": null
 }