End of training

Browse files

Files changed (6) hide show

README.md +3 -3
all_results.json +11 -11
eval_results.json +6 -6
runs/May10_13-31-13_85d2b2bb10f2/events.out.tfevents.1715348077.85d2b2bb10f2.34.1 +3 -0
train_results.json +6 -6
trainer_state.json +47 -789

README.md CHANGED Viewed

@@ -22,7 +22,7 @@ model-index:
     metrics:
     - name: Accuracy
       type: accuracy
-      value: 0.8398692810457516
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -32,8 +32,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [microsoft/swin-tiny-patch4-window7-224](https://huggingface.co/microsoft/swin-tiny-patch4-window7-224) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.3353
-- Accuracy: 0.8399
 ## Model description

     metrics:
     - name: Accuracy
       type: accuracy
+      value: 0.8660130718954249
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 This model is a fine-tuned version of [microsoft/swin-tiny-patch4-window7-224](https://huggingface.co/microsoft/swin-tiny-patch4-window7-224) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.2897
+- Accuracy: 0.8660
 ## Model description

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
-    "epoch": 9.98,
-    "eval_accuracy": 0.9119915848527349,
-    "eval_loss": 0.3377525210380554,
-    "eval_runtime": 37.4095,
-    "eval_samples_per_second": 76.237,
-    "eval_steps_per_second": 1.203,
-    "total_flos": 6.364199987970048e+18,
-    "train_loss": 0.11027517792582511,
-    "train_runtime": 4749.2843,
-    "train_samples_per_second": 54.038,
-    "train_steps_per_second": 0.211
 }

 {
+    "epoch": 2.79,
+    "eval_accuracy": 0.8660130718954249,
+    "eval_loss": 0.28969407081604004,
+    "eval_runtime": 2.0116,
+    "eval_samples_per_second": 152.115,
+    "eval_steps_per_second": 2.486,
+    "total_flos": 1.9084961608228454e+17,
+    "train_loss": 0.4112351576487223,
+    "train_runtime": 186.8069,
+    "train_samples_per_second": 44.179,
+    "train_steps_per_second": 0.161
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 9.98,
-    "eval_accuracy": 0.9119915848527349,
-    "eval_loss": 0.3377525210380554,
-    "eval_runtime": 37.4095,
-    "eval_samples_per_second": 76.237,
-    "eval_steps_per_second": 1.203
 }

 {
+    "epoch": 2.79,
+    "eval_accuracy": 0.8660130718954249,
+    "eval_loss": 0.28969407081604004,
+    "eval_runtime": 2.0116,
+    "eval_samples_per_second": 152.115,
+    "eval_steps_per_second": 2.486
 }

runs/May10_13-31-13_85d2b2bb10f2/events.out.tfevents.1715348077.85d2b2bb10f2.34.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ffdbfeb295a15d885e2b951bb2fadf4e412db2a817e7499a73c33078d097eba9
+size 405

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 9.98,
-    "total_flos": 6.364199987970048e+18,
-    "train_loss": 0.11027517792582511,
-    "train_runtime": 4749.2843,
-    "train_samples_per_second": 54.038,
-    "train_steps_per_second": 0.211
 }

 {
+    "epoch": 2.79,
+    "total_flos": 1.9084961608228454e+17,
+    "train_loss": 0.4112351576487223,
+    "train_runtime": 186.8069,
+    "train_samples_per_second": 44.179,
+    "train_steps_per_second": 0.161
 }

trainer_state.json CHANGED Viewed

@@ -1,819 +1,77 @@
 {
-  "best_metric": 0.9119915848527349,
-  "best_model_checkpoint": "swin-tiny-patch4-window7-224-finetuned-eurosat/checkpoint-1000",
-  "epoch": 9.975062344139651,
   "eval_steps": 500,
-  "global_step": 1000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.1,
-      "grad_norm": 7.060407638549805,
-      "learning_rate": 1e-05,
-      "loss": 0.1774,
       "step": 10
     },
     {
-      "epoch": 0.2,
-      "grad_norm": 4.514194011688232,
-      "learning_rate": 2e-05,
-      "loss": 0.118,
-      "step": 20
-    },
-    {
-      "epoch": 0.3,
-      "grad_norm": 5.400581359863281,
-      "learning_rate": 3e-05,
-      "loss": 0.1062,
-      "step": 30
-    },
-    {
-      "epoch": 0.4,
-      "grad_norm": 5.083698749542236,
-      "learning_rate": 4e-05,
-      "loss": 0.074,
-      "step": 40
-    },
-    {
-      "epoch": 0.5,
-      "grad_norm": 2.7988944053649902,
-      "learning_rate": 5e-05,
-      "loss": 0.0639,
-      "step": 50
-    },
-    {
-      "epoch": 0.6,
-      "grad_norm": 1.6099319458007812,
-      "learning_rate": 6e-05,
-      "loss": 0.0508,
-      "step": 60
-    },
-    {
-      "epoch": 0.7,
-      "grad_norm": 2.6441915035247803,
-      "learning_rate": 7e-05,
-      "loss": 0.0524,
-      "step": 70
-    },
-    {
-      "epoch": 0.8,
-      "grad_norm": 5.100390434265137,
-      "learning_rate": 8e-05,
-      "loss": 0.06,
-      "step": 80
-    },
-    {
-      "epoch": 0.9,
-      "grad_norm": 4.311460971832275,
-      "learning_rate": 9e-05,
-      "loss": 0.0424,
-      "step": 90
-    },
-    {
-      "epoch": 1.0,
-      "grad_norm": 2.94564151763916,
-      "learning_rate": 0.0001,
-      "loss": 0.0511,
-      "step": 100
-    },
-    {
-      "epoch": 1.0,
-      "eval_accuracy": 0.8720196353436185,
-      "eval_loss": 0.5181019306182861,
-      "eval_runtime": 38.2631,
-      "eval_samples_per_second": 74.537,
-      "eval_steps_per_second": 1.176,
-      "step": 100
-    },
-    {
-      "epoch": 1.1,
-      "grad_norm": 4.313048839569092,
-      "learning_rate": 9.888888888888889e-05,
-      "loss": 0.0887,
-      "step": 110
-    },
-    {
-      "epoch": 1.2,
-      "grad_norm": 5.640860557556152,
-      "learning_rate": 9.777777777777778e-05,
-      "loss": 0.084,
-      "step": 120
-    },
-    {
-      "epoch": 1.3,
-      "grad_norm": 2.4771900177001953,
-      "learning_rate": 9.666666666666667e-05,
-      "loss": 0.0879,
-      "step": 130
-    },
-    {
-      "epoch": 1.4,
-      "grad_norm": 7.712289810180664,
-      "learning_rate": 9.555555555555557e-05,
-      "loss": 0.1231,
-      "step": 140
-    },
-    {
-      "epoch": 1.5,
-      "grad_norm": 7.235645771026611,
-      "learning_rate": 9.444444444444444e-05,
-      "loss": 0.143,
-      "step": 150
-    },
-    {
-      "epoch": 1.6,
-      "grad_norm": 11.080587387084961,
-      "learning_rate": 9.333333333333334e-05,
-      "loss": 0.1804,
-      "step": 160
-    },
-    {
-      "epoch": 1.7,
-      "grad_norm": 4.359196662902832,
-      "learning_rate": 9.222222222222223e-05,
-      "loss": 0.1894,
-      "step": 170
-    },
-    {
-      "epoch": 1.8,
-      "grad_norm": 4.214484214782715,
-      "learning_rate": 9.111111111111112e-05,
-      "loss": 0.1589,
-      "step": 180
-    },
-    {
-      "epoch": 1.9,
-      "grad_norm": 6.100831508636475,
-      "learning_rate": 9e-05,
-      "loss": 0.1317,
-      "step": 190
-    },
-    {
-      "epoch": 2.0,
-      "grad_norm": 4.592179298400879,
-      "learning_rate": 8.888888888888889e-05,
-      "loss": 0.1166,
-      "step": 200
-    },
-    {
-      "epoch": 2.0,
-      "eval_accuracy": 0.8716690042075736,
-      "eval_loss": 0.4709436595439911,
-      "eval_runtime": 38.3291,
-      "eval_samples_per_second": 74.408,
-      "eval_steps_per_second": 1.174,
-      "step": 200
-    },
-    {
-      "epoch": 2.09,
-      "grad_norm": 9.383784294128418,
-      "learning_rate": 8.777777777777778e-05,
-      "loss": 0.1538,
-      "step": 210
-    },
-    {
-      "epoch": 2.19,
-      "grad_norm": 5.486557960510254,
-      "learning_rate": 8.666666666666667e-05,
-      "loss": 0.1292,
-      "step": 220
-    },
-    {
-      "epoch": 2.29,
-      "grad_norm": 5.093433856964111,
-      "learning_rate": 8.555555555555556e-05,
-      "loss": 0.1411,
-      "step": 230
-    },
-    {
-      "epoch": 2.39,
-      "grad_norm": 6.046931266784668,
-      "learning_rate": 8.444444444444444e-05,
-      "loss": 0.1502,
-      "step": 240
-    },
-    {
-      "epoch": 2.49,
-      "grad_norm": 6.943304061889648,
-      "learning_rate": 8.333333333333334e-05,
-      "loss": 0.1298,
-      "step": 250
     },
     {
-      "epoch": 2.59,
-      "grad_norm": 4.685500621795654,
-      "learning_rate": 8.222222222222222e-05,
-      "loss": 0.1301,
-      "step": 260
     },
     {
-      "epoch": 2.69,
-      "grad_norm": 4.650270462036133,
-      "learning_rate": 8.111111111111112e-05,
-      "loss": 0.1342,
-      "step": 270
     },
     {
       "epoch": 2.79,
-      "grad_norm": 8.815176010131836,
-      "learning_rate": 8e-05,
-      "loss": 0.1353,
-      "step": 280
-    },
-    {
-      "epoch": 2.89,
-      "grad_norm": 6.133541584014893,
-      "learning_rate": 7.88888888888889e-05,
-      "loss": 0.1252,
-      "step": 290
-    },
-    {
-      "epoch": 2.99,
-      "grad_norm": 5.344182014465332,
-      "learning_rate": 7.777777777777778e-05,
-      "loss": 0.1189,
-      "step": 300
-    },
-    {
-      "epoch": 2.99,
-      "eval_accuracy": 0.8839410939691444,
-      "eval_loss": 0.41620370745658875,
-      "eval_runtime": 38.187,
-      "eval_samples_per_second": 74.685,
-      "eval_steps_per_second": 1.178,
-      "step": 300
-    },
-    {
-      "epoch": 3.09,
-      "grad_norm": 5.3231706619262695,
-      "learning_rate": 7.666666666666667e-05,
-      "loss": 0.11,
-      "step": 310
-    },
-    {
-      "epoch": 3.19,
-      "grad_norm": 6.189892292022705,
-      "learning_rate": 7.555555555555556e-05,
-      "loss": 0.1151,
-      "step": 320
-    },
-    {
-      "epoch": 3.29,
-      "grad_norm": 4.102895259857178,
-      "learning_rate": 7.444444444444444e-05,
-      "loss": 0.1023,
-      "step": 330
-    },
-    {
-      "epoch": 3.39,
-      "grad_norm": 4.935023784637451,
-      "learning_rate": 7.333333333333333e-05,
-      "loss": 0.1298,
-      "step": 340
-    },
-    {
-      "epoch": 3.49,
-      "grad_norm": 6.158393859863281,
-      "learning_rate": 7.222222222222222e-05,
-      "loss": 0.1382,
-      "step": 350
-    },
-    {
-      "epoch": 3.59,
-      "grad_norm": 4.13533878326416,
-      "learning_rate": 7.111111111111112e-05,
-      "loss": 0.1526,
-      "step": 360
-    },
-    {
-      "epoch": 3.69,
-      "grad_norm": 2.808582067489624,
-      "learning_rate": 7e-05,
-      "loss": 0.1106,
-      "step": 370
-    },
-    {
-      "epoch": 3.79,
-      "grad_norm": 4.059571266174316,
-      "learning_rate": 6.88888888888889e-05,
-      "loss": 0.1221,
-      "step": 380
-    },
-    {
-      "epoch": 3.89,
-      "grad_norm": 4.626064777374268,
-      "learning_rate": 6.777777777777778e-05,
-      "loss": 0.1303,
-      "step": 390
-    },
-    {
-      "epoch": 3.99,
-      "grad_norm": 6.2365031242370605,
-      "learning_rate": 6.666666666666667e-05,
-      "loss": 0.1306,
-      "step": 400
-    },
-    {
-      "epoch": 4.0,
-      "eval_accuracy": 0.8807854137447405,
-      "eval_loss": 0.4251408874988556,
-      "eval_runtime": 38.3771,
-      "eval_samples_per_second": 74.315,
-      "eval_steps_per_second": 1.173,
-      "step": 401
-    },
-    {
-      "epoch": 4.09,
-      "grad_norm": 4.386157035827637,
-      "learning_rate": 6.555555555555556e-05,
-      "loss": 0.1149,
-      "step": 410
-    },
-    {
-      "epoch": 4.19,
-      "grad_norm": 5.805418968200684,
-      "learning_rate": 6.444444444444446e-05,
-      "loss": 0.0997,
-      "step": 420
-    },
-    {
-      "epoch": 4.29,
-      "grad_norm": 7.228994846343994,
-      "learning_rate": 6.333333333333333e-05,
-      "loss": 0.1262,
-      "step": 430
-    },
-    {
-      "epoch": 4.39,
-      "grad_norm": 8.70606517791748,
-      "learning_rate": 6.222222222222222e-05,
-      "loss": 0.1422,
-      "step": 440
-    },
-    {
-      "epoch": 4.49,
-      "grad_norm": 5.861635208129883,
-      "learning_rate": 6.111111111111112e-05,
-      "loss": 0.1128,
-      "step": 450
-    },
-    {
-      "epoch": 4.59,
-      "grad_norm": 5.075900554656982,
-      "learning_rate": 6e-05,
-      "loss": 0.1142,
-      "step": 460
-    },
-    {
-      "epoch": 4.69,
-      "grad_norm": 5.3067498207092285,
-      "learning_rate": 5.8888888888888896e-05,
-      "loss": 0.1359,
-      "step": 470
-    },
-    {
-      "epoch": 4.79,
-      "grad_norm": 3.890895366668701,
-      "learning_rate": 5.7777777777777776e-05,
-      "loss": 0.1173,
-      "step": 480
-    },
-    {
-      "epoch": 4.89,
-      "grad_norm": 5.006656646728516,
-      "learning_rate": 5.666666666666667e-05,
-      "loss": 0.1087,
-      "step": 490
-    },
-    {
-      "epoch": 4.99,
-      "grad_norm": 4.467653274536133,
-      "learning_rate": 5.555555555555556e-05,
-      "loss": 0.1063,
-      "step": 500
-    },
-    {
-      "epoch": 5.0,
-      "eval_accuracy": 0.8888499298737728,
-      "eval_loss": 0.41856977343559265,
-      "eval_runtime": 37.7302,
-      "eval_samples_per_second": 75.589,
-      "eval_steps_per_second": 1.193,
-      "step": 501
-    },
-    {
-      "epoch": 5.09,
-      "grad_norm": 6.331502914428711,
-      "learning_rate": 5.4444444444444446e-05,
-      "loss": 0.1132,
-      "step": 510
-    },
-    {
-      "epoch": 5.19,
-      "grad_norm": 6.853649139404297,
-      "learning_rate": 5.333333333333333e-05,
-      "loss": 0.1256,
-      "step": 520
-    },
-    {
-      "epoch": 5.29,
-      "grad_norm": 6.621553421020508,
-      "learning_rate": 5.222222222222223e-05,
-      "loss": 0.121,
-      "step": 530
-    },
-    {
-      "epoch": 5.39,
-      "grad_norm": 5.279974460601807,
-      "learning_rate": 5.111111111111111e-05,
-      "loss": 0.1119,
-      "step": 540
-    },
-    {
-      "epoch": 5.49,
-      "grad_norm": 6.570211410522461,
-      "learning_rate": 5e-05,
-      "loss": 0.1067,
-      "step": 550
-    },
-    {
-      "epoch": 5.59,
-      "grad_norm": 4.3511199951171875,
-      "learning_rate": 4.888888888888889e-05,
-      "loss": 0.1202,
-      "step": 560
-    },
-    {
-      "epoch": 5.69,
-      "grad_norm": 4.396121978759766,
-      "learning_rate": 4.7777777777777784e-05,
-      "loss": 0.1041,
-      "step": 570
-    },
-    {
-      "epoch": 5.79,
-      "grad_norm": 5.755546569824219,
-      "learning_rate": 4.666666666666667e-05,
-      "loss": 0.1144,
-      "step": 580
-    },
-    {
-      "epoch": 5.89,
-      "grad_norm": 4.096261501312256,
-      "learning_rate": 4.555555555555556e-05,
-      "loss": 0.109,
-      "step": 590
-    },
-    {
-      "epoch": 5.99,
-      "grad_norm": 7.311570644378662,
-      "learning_rate": 4.4444444444444447e-05,
-      "loss": 0.1188,
-      "step": 600
-    },
-    {
-      "epoch": 6.0,
-      "eval_accuracy": 0.8842917251051894,
-      "eval_loss": 0.4293117821216583,
-      "eval_runtime": 36.9523,
-      "eval_samples_per_second": 77.181,
-      "eval_steps_per_second": 1.218,
-      "step": 601
-    },
-    {
-      "epoch": 6.08,
-      "grad_norm": 3.6034762859344482,
-      "learning_rate": 4.3333333333333334e-05,
-      "loss": 0.1118,
-      "step": 610
-    },
-    {
-      "epoch": 6.18,
-      "grad_norm": 5.649061679840088,
-      "learning_rate": 4.222222222222222e-05,
-      "loss": 0.1005,
-      "step": 620
-    },
-    {
-      "epoch": 6.28,
-      "grad_norm": 6.543485164642334,
-      "learning_rate": 4.111111111111111e-05,
-      "loss": 0.1012,
-      "step": 630
-    },
-    {
-      "epoch": 6.38,
-      "grad_norm": 5.104783058166504,
-      "learning_rate": 4e-05,
-      "loss": 0.0862,
-      "step": 640
-    },
-    {
-      "epoch": 6.48,
-      "grad_norm": 7.024726867675781,
-      "learning_rate": 3.888888888888889e-05,
-      "loss": 0.1063,
-      "step": 650
-    },
-    {
-      "epoch": 6.58,
-      "grad_norm": 3.0800111293792725,
-      "learning_rate": 3.777777777777778e-05,
-      "loss": 0.0974,
-      "step": 660
-    },
-    {
-      "epoch": 6.68,
-      "grad_norm": 8.348942756652832,
-      "learning_rate": 3.6666666666666666e-05,
-      "loss": 0.1079,
-      "step": 670
-    },
-    {
-      "epoch": 6.78,
-      "grad_norm": 5.644587516784668,
-      "learning_rate": 3.555555555555556e-05,
-      "loss": 0.0917,
-      "step": 680
-    },
-    {
-      "epoch": 6.88,
-      "grad_norm": 6.3199872970581055,
-      "learning_rate": 3.444444444444445e-05,
-      "loss": 0.1043,
-      "step": 690
-    },
-    {
-      "epoch": 6.98,
-      "grad_norm": 7.193106174468994,
-      "learning_rate": 3.3333333333333335e-05,
-      "loss": 0.1293,
-      "step": 700
-    },
-    {
-      "epoch": 6.99,
-      "eval_accuracy": 0.9032258064516129,
-      "eval_loss": 0.3595149517059326,
-      "eval_runtime": 37.0853,
-      "eval_samples_per_second": 76.904,
-      "eval_steps_per_second": 1.213,
-      "step": 701
-    },
-    {
-      "epoch": 7.08,
-      "grad_norm": 5.787723541259766,
-      "learning_rate": 3.222222222222223e-05,
-      "loss": 0.1175,
-      "step": 710
-    },
-    {
-      "epoch": 7.18,
-      "grad_norm": 3.8590798377990723,
-      "learning_rate": 3.111111111111111e-05,
-      "loss": 0.1003,
-      "step": 720
-    },
-    {
-      "epoch": 7.28,
-      "grad_norm": 4.482466220855713,
-      "learning_rate": 3e-05,
-      "loss": 0.0991,
-      "step": 730
-    },
-    {
-      "epoch": 7.38,
-      "grad_norm": 2.0709593296051025,
-      "learning_rate": 2.8888888888888888e-05,
-      "loss": 0.0827,
-      "step": 740
-    },
-    {
-      "epoch": 7.48,
-      "grad_norm": 5.126271724700928,
-      "learning_rate": 2.777777777777778e-05,
-      "loss": 0.1008,
-      "step": 750
-    },
-    {
-      "epoch": 7.58,
-      "grad_norm": 4.332973003387451,
-      "learning_rate": 2.6666666666666667e-05,
-      "loss": 0.0805,
-      "step": 760
-    },
-    {
-      "epoch": 7.68,
-      "grad_norm": 4.371252059936523,
-      "learning_rate": 2.5555555555555554e-05,
-      "loss": 0.0951,
-      "step": 770
-    },
-    {
-      "epoch": 7.78,
-      "grad_norm": 4.181329250335693,
-      "learning_rate": 2.4444444444444445e-05,
-      "loss": 0.0937,
-      "step": 780
-    },
-    {
-      "epoch": 7.88,
-      "grad_norm": 4.650885581970215,
-      "learning_rate": 2.3333333333333336e-05,
-      "loss": 0.0857,
-      "step": 790
-    },
-    {
-      "epoch": 7.98,
-      "grad_norm": 5.875858306884766,
-      "learning_rate": 2.2222222222222223e-05,
-      "loss": 0.1094,
-      "step": 800
-    },
-    {
-      "epoch": 8.0,
-      "eval_accuracy": 0.8993688639551192,
-      "eval_loss": 0.36655670404434204,
-      "eval_runtime": 37.936,
-      "eval_samples_per_second": 75.179,
-      "eval_steps_per_second": 1.186,
-      "step": 802
-    },
-    {
-      "epoch": 8.08,
-      "grad_norm": 6.7501349449157715,
-      "learning_rate": 2.111111111111111e-05,
-      "loss": 0.1025,
-      "step": 810
-    },
-    {
-      "epoch": 8.18,
-      "grad_norm": 4.238629341125488,
-      "learning_rate": 2e-05,
-      "loss": 0.0783,
-      "step": 820
-    },
-    {
-      "epoch": 8.28,
-      "grad_norm": 4.994195938110352,
-      "learning_rate": 1.888888888888889e-05,
-      "loss": 0.0989,
-      "step": 830
-    },
-    {
-      "epoch": 8.38,
-      "grad_norm": 4.091785430908203,
-      "learning_rate": 1.777777777777778e-05,
-      "loss": 0.093,
-      "step": 840
-    },
-    {
-      "epoch": 8.48,
-      "grad_norm": 4.5268378257751465,
-      "learning_rate": 1.6666666666666667e-05,
-      "loss": 0.0993,
-      "step": 850
-    },
-    {
-      "epoch": 8.58,
-      "grad_norm": 4.056771755218506,
-      "learning_rate": 1.5555555555555555e-05,
-      "loss": 0.0989,
-      "step": 860
-    },
-    {
-      "epoch": 8.68,
-      "grad_norm": 3.3963980674743652,
-      "learning_rate": 1.4444444444444444e-05,
-      "loss": 0.0975,
-      "step": 870
-    },
-    {
-      "epoch": 8.78,
-      "grad_norm": 4.109832763671875,
-      "learning_rate": 1.3333333333333333e-05,
-      "loss": 0.1079,
-      "step": 880
-    },
-    {
-      "epoch": 8.88,
-      "grad_norm": 4.538650035858154,
-      "learning_rate": 1.2222222222222222e-05,
-      "loss": 0.091,
-      "step": 890
-    },
-    {
-      "epoch": 8.98,
-      "grad_norm": 3.982865571975708,
-      "learning_rate": 1.1111111111111112e-05,
-      "loss": 0.1047,
-      "step": 900
-    },
-    {
-      "epoch": 9.0,
-      "eval_accuracy": 0.9021739130434783,
-      "eval_loss": 0.3615379333496094,
-      "eval_runtime": 37.2047,
-      "eval_samples_per_second": 76.657,
-      "eval_steps_per_second": 1.21,
-      "step": 902
-    },
-    {
-      "epoch": 9.08,
-      "grad_norm": 5.261457920074463,
-      "learning_rate": 1e-05,
-      "loss": 0.1016,
-      "step": 910
-    },
-    {
-      "epoch": 9.18,
-      "grad_norm": 4.270400047302246,
-      "learning_rate": 8.88888888888889e-06,
-      "loss": 0.109,
-      "step": 920
-    },
-    {
-      "epoch": 9.28,
-      "grad_norm": 4.025336265563965,
-      "learning_rate": 7.777777777777777e-06,
-      "loss": 0.0955,
-      "step": 930
-    },
-    {
-      "epoch": 9.38,
-      "grad_norm": 4.099737167358398,
-      "learning_rate": 6.666666666666667e-06,
-      "loss": 0.1024,
-      "step": 940
-    },
-    {
-      "epoch": 9.48,
-      "grad_norm": 4.68928861618042,
-      "learning_rate": 5.555555555555556e-06,
-      "loss": 0.1069,
-      "step": 950
-    },
-    {
-      "epoch": 9.58,
-      "grad_norm": 4.062239170074463,
-      "learning_rate": 4.444444444444445e-06,
-      "loss": 0.0971,
-      "step": 960
-    },
-    {
-      "epoch": 9.68,
-      "grad_norm": 3.338601589202881,
-      "learning_rate": 3.3333333333333333e-06,
-      "loss": 0.1033,
-      "step": 970
-    },
-    {
-      "epoch": 9.78,
-      "grad_norm": 7.083847522735596,
-      "learning_rate": 2.2222222222222225e-06,
-      "loss": 0.1139,
-      "step": 980
-    },
-    {
-      "epoch": 9.88,
-      "grad_norm": 5.833040714263916,
-      "learning_rate": 1.1111111111111112e-06,
-      "loss": 0.1198,
-      "step": 990
-    },
-    {
-      "epoch": 9.98,
-      "grad_norm": 4.501120567321777,
       "learning_rate": 0.0,
-      "loss": 0.0925,
-      "step": 1000
     },
     {
-      "epoch": 9.98,
-      "eval_accuracy": 0.9119915848527349,
-      "eval_loss": 0.3377525210380554,
-      "eval_runtime": 37.2843,
-      "eval_samples_per_second": 76.493,
-      "eval_steps_per_second": 1.207,
-      "step": 1000
     },
     {
-      "epoch": 9.98,
-      "step": 1000,
-      "total_flos": 6.364199987970048e+18,
-      "train_loss": 0.11027517792582511,
-      "train_runtime": 4749.2843,
-      "train_samples_per_second": 54.038,
-      "train_steps_per_second": 0.211
     }
   ],
   "logging_steps": 10,
-  "max_steps": 1000,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 10,
   "save_steps": 500,
-  "total_flos": 6.364199987970048e+18,
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 0.8660130718954249,
+  "best_model_checkpoint": "swin-tiny-patch4-window7-224-finetuned-eurosat/checkpoint-21",
+  "epoch": 2.7906976744186047,
   "eval_steps": 500,
+  "global_step": 30,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.93,
+      "grad_norm": 4.1663103103637695,
+      "learning_rate": 3.7037037037037037e-05,
+      "loss": 0.7396,
       "step": 10
     },
     {
+      "epoch": 0.93,
+      "eval_accuracy": 0.8496732026143791,
+      "eval_loss": 0.3929253816604614,
+      "eval_runtime": 3.0907,
+      "eval_samples_per_second": 99.005,
+      "eval_steps_per_second": 1.618,
+      "step": 10
     },
     {
+      "epoch": 1.86,
+      "grad_norm": 3.590320348739624,
+      "learning_rate": 1.8518518518518518e-05,
+      "loss": 0.2666,
+      "step": 20
     },
     {
+      "epoch": 1.95,
+      "eval_accuracy": 0.8660130718954249,
+      "eval_loss": 0.28969407081604004,
+      "eval_runtime": 1.9505,
+      "eval_samples_per_second": 156.885,
+      "eval_steps_per_second": 2.563,
+      "step": 21
     },
     {
       "epoch": 2.79,
+      "grad_norm": 4.9571614265441895,
       "learning_rate": 0.0,
+      "loss": 0.2275,
+      "step": 30
     },
     {
+      "epoch": 2.79,
+      "eval_accuracy": 0.8398692810457516,
+      "eval_loss": 0.3352753520011902,
+      "eval_runtime": 1.9602,
+      "eval_samples_per_second": 156.109,
+      "eval_steps_per_second": 2.551,
+      "step": 30
     },
     {
+      "epoch": 2.79,
+      "step": 30,
+      "total_flos": 1.9084961608228454e+17,
+      "train_loss": 0.4112351576487223,
+      "train_runtime": 186.8069,
+      "train_samples_per_second": 44.179,
+      "train_steps_per_second": 0.161
     }
   ],
   "logging_steps": 10,
+  "max_steps": 30,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
   "save_steps": 500,
+  "total_flos": 1.9084961608228454e+17,
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": null