Training in progress, step 100

Browse files

Files changed (9) hide show

all_results.json +9 -9
config.json +6 -6
eval_results.json +5 -5
pytorch_model.bin +1 -1
runs/Aug24_12-31-14_surveily-ag-02/events.out.tfevents.1692873360.surveily-ag-02.7570.1 +3 -0
runs/Aug24_12-57-54_surveily-ag-02/events.out.tfevents.1692874678.surveily-ag-02.7570.2 +3 -0
train_results.json +4 -4
trainer_state.json +135 -114
training_args.bin +1 -1

all_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
     "epoch": 20.0,
-    "eval_accuracy": 0.8181818181818182,
-    "eval_loss": 0.7126299142837524,
-    "eval_runtime": 1.7324,
-    "eval_samples_per_second": 19.048,
-    "eval_steps_per_second": 2.886,
-    "train_loss": 0.1071862239856273,
-    "train_runtime": 140.5527,
-    "train_samples_per_second": 7.826,
-    "train_steps_per_second": 1.992
 }

 {
     "epoch": 20.0,
+    "eval_accuracy": 0.9444444444444444,
+    "eval_loss": 0.29236936569213867,
+    "eval_runtime": 1.9546,
+    "eval_samples_per_second": 18.418,
+    "eval_steps_per_second": 2.558,
+    "train_loss": 0.13472866227229435,
+    "train_runtime": 231.7859,
+    "train_samples_per_second": 5.177,
+    "train_steps_per_second": 1.294
 }

config.json CHANGED Viewed

@@ -17,9 +17,9 @@
     "3": "building_site",
     "4": "factory",
     "5": "food",
-    "6": "house",
-    "7": "office",
-    "8": "road",
     "9": "skatepart"
   },
   "image_size": 224,
@@ -32,9 +32,9 @@
     "building_site": "3",
     "factory": "4",
     "food": "5",
-    "house": "6",
-    "office": "7",
-    "road": "8",
     "skatepart": "9",
     "warehouse": "10",
     "zoo": "11"

     "3": "building_site",
     "4": "factory",
     "5": "food",
+    "6": "office",
+    "7": "road",
+    "8": "skatepark",
     "9": "skatepart"
   },
   "image_size": 224,
     "building_site": "3",
     "factory": "4",
     "food": "5",
+    "office": "6",
+    "road": "7",
+    "skatepark": "8",
     "skatepart": "9",
     "warehouse": "10",
     "zoo": "11"

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 20.0,
-    "eval_accuracy": 0.8181818181818182,
-    "eval_loss": 0.7126299142837524,
-    "eval_runtime": 1.7324,
-    "eval_samples_per_second": 19.048,
-    "eval_steps_per_second": 2.886
 }

 {
     "epoch": 20.0,
+    "eval_accuracy": 0.9444444444444444,
+    "eval_loss": 0.29236936569213867,
+    "eval_runtime": 1.9546,
+    "eval_samples_per_second": 18.418,
+    "eval_steps_per_second": 2.558
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6b19806ff6239529d9aabe437ae0e9a936bce95a080c95388102f36c105c1b1e
 size 343299437

 version https://git-lfs.github.com/spec/v1
+oid sha256:7dd98cc78c1a563980f48c5611699ed17798f72747c76fc7360a45ac23d62092
 size 343299437

runs/Aug24_12-31-14_surveily-ag-02/events.out.tfevents.1692873360.surveily-ag-02.7570.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:525c6b5796d2cb1620a57db96771fd2705b36583a507393b7fa007a0c35a0494
+size 411

runs/Aug24_12-57-54_surveily-ag-02/events.out.tfevents.1692874678.surveily-ag-02.7570.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eeb9f8dc3c58c856bb4fb3db142bc05d10e36b21e334a96b10f316df0458295a
+size 6610

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
     "epoch": 20.0,
-    "train_loss": 0.1071862239856273,
-    "train_runtime": 140.5527,
-    "train_samples_per_second": 7.826,
-    "train_steps_per_second": 1.992
 }

 {
     "epoch": 20.0,
+    "train_loss": 0.13472866227229435,
+    "train_runtime": 231.7859,
+    "train_samples_per_second": 5.177,
+    "train_steps_per_second": 1.294
 }

trainer_state.json CHANGED Viewed

@@ -1,238 +1,259 @@
 {
-  "best_metric": 0.7126299142837524,
-  "best_model_checkpoint": "./vit-base/checkpoint-200",
   "epoch": 20.0,
-  "global_step": 280,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.71,
-      "learning_rate": 0.00019357142857142858,
-      "loss": 2.073,
       "step": 10
     },
     {
-      "epoch": 1.43,
-      "learning_rate": 0.00018642857142857144,
-      "loss": 0.6674,
       "step": 20
     },
     {
-      "epoch": 2.14,
-      "learning_rate": 0.0001792857142857143,
-      "loss": 0.1817,
       "step": 30
     },
     {
-      "epoch": 2.86,
-      "learning_rate": 0.00017214285714285717,
-      "loss": 0.0578,
       "step": 40
     },
     {
-      "epoch": 3.57,
-      "learning_rate": 0.000165,
-      "loss": 0.0041,
       "step": 50
     },
     {
-      "epoch": 3.57,
-      "eval_accuracy": 0.7575757575757576,
-      "eval_loss": 0.5183216333389282,
-      "eval_runtime": 1.6943,
-      "eval_samples_per_second": 19.477,
-      "eval_steps_per_second": 2.951,
       "step": 50
     },
     {
-      "epoch": 4.29,
-      "learning_rate": 0.00015785714285714285,
-      "loss": 0.007,
       "step": 60
     },
     {
-      "epoch": 5.0,
-      "learning_rate": 0.0001507142857142857,
-      "loss": 0.0018,
       "step": 70
     },
     {
-      "epoch": 5.71,
-      "learning_rate": 0.0001435714285714286,
-      "loss": 0.0009,
       "step": 80
     },
     {
-      "epoch": 6.43,
-      "learning_rate": 0.00013642857142857144,
-      "loss": 0.0007,
       "step": 90
     },
     {
-      "epoch": 7.14,
-      "learning_rate": 0.0001292857142857143,
-      "loss": 0.0006,
       "step": 100
     },
     {
-      "epoch": 7.14,
-      "eval_accuracy": 0.8181818181818182,
-      "eval_loss": 0.7554123401641846,
-      "eval_runtime": 1.4254,
-      "eval_samples_per_second": 23.151,
-      "eval_steps_per_second": 3.508,
       "step": 100
     },
     {
-      "epoch": 7.86,
-      "learning_rate": 0.00012214285714285715,
-      "loss": 0.0005,
       "step": 110
     },
     {
-      "epoch": 8.57,
-      "learning_rate": 0.00011499999999999999,
-      "loss": 0.0005,
       "step": 120
     },
     {
-      "epoch": 9.29,
-      "learning_rate": 0.00010785714285714286,
-      "loss": 0.0004,
       "step": 130
     },
     {
-      "epoch": 10.0,
-      "learning_rate": 0.00010071428571428571,
-      "loss": 0.0004,
       "step": 140
     },
     {
-      "epoch": 10.71,
-      "learning_rate": 9.357142857142858e-05,
       "loss": 0.0004,
       "step": 150
     },
     {
-      "epoch": 10.71,
-      "eval_accuracy": 0.8181818181818182,
-      "eval_loss": 0.7197360396385193,
-      "eval_runtime": 1.4885,
-      "eval_samples_per_second": 22.17,
-      "eval_steps_per_second": 3.359,
       "step": 150
     },
     {
-      "epoch": 11.43,
-      "learning_rate": 8.642857142857143e-05,
       "loss": 0.0004,
       "step": 160
     },
     {
-      "epoch": 12.14,
-      "learning_rate": 7.928571428571429e-05,
-      "loss": 0.0003,
       "step": 170
     },
     {
-      "epoch": 12.86,
-      "learning_rate": 7.214285714285714e-05,
-      "loss": 0.0003,
       "step": 180
     },
     {
-      "epoch": 13.57,
-      "learning_rate": 6.500000000000001e-05,
       "loss": 0.0003,
       "step": 190
     },
     {
-      "epoch": 14.29,
-      "learning_rate": 5.785714285714287e-05,
-      "loss": 0.0003,
       "step": 200
     },
     {
-      "epoch": 14.29,
-      "eval_accuracy": 0.8181818181818182,
-      "eval_loss": 0.7126299142837524,
-      "eval_runtime": 1.5758,
-      "eval_samples_per_second": 20.942,
-      "eval_steps_per_second": 3.173,
       "step": 200
     },
     {
-      "epoch": 15.0,
-      "learning_rate": 5.0714285714285716e-05,
       "loss": 0.0003,
       "step": 210
     },
     {
-      "epoch": 15.71,
-      "learning_rate": 4.3571428571428576e-05,
       "loss": 0.0003,
       "step": 220
     },
     {
-      "epoch": 16.43,
-      "learning_rate": 3.642857142857143e-05,
       "loss": 0.0003,
       "step": 230
     },
     {
-      "epoch": 17.14,
-      "learning_rate": 2.9285714285714288e-05,
       "loss": 0.0003,
       "step": 240
     },
     {
-      "epoch": 17.86,
-      "learning_rate": 2.214285714285714e-05,
       "loss": 0.0003,
       "step": 250
     },
     {
-      "epoch": 17.86,
-      "eval_accuracy": 0.8181818181818182,
-      "eval_loss": 0.7098276615142822,
-      "eval_runtime": 1.5439,
-      "eval_samples_per_second": 21.374,
-      "eval_steps_per_second": 3.239,
       "step": 250
     },
     {
-      "epoch": 18.57,
-      "learning_rate": 1.5e-05,
       "loss": 0.0003,
       "step": 260
     },
     {
-      "epoch": 19.29,
-      "learning_rate": 7.857142857142858e-06,
       "loss": 0.0003,
       "step": 270
     },
     {
-      "epoch": 20.0,
-      "learning_rate": 7.142857142857143e-07,
       "loss": 0.0003,
       "step": 280
     },
     {
       "epoch": 20.0,
-      "step": 280,
-      "total_flos": 8.5248064484352e+16,
-      "train_loss": 0.1071862239856273,
-      "train_runtime": 140.5527,
-      "train_samples_per_second": 7.826,
-      "train_steps_per_second": 1.992
     }
   ],
-  "max_steps": 280,
   "num_train_epochs": 20,
-  "total_flos": 8.5248064484352e+16,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.29236936569213867,
+  "best_model_checkpoint": "./vit-base/checkpoint-300",
   "epoch": 20.0,
+  "global_step": 300,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.67,
+      "learning_rate": 0.000194,
+      "loss": 2.2893,
       "step": 10
     },
     {
+      "epoch": 1.33,
+      "learning_rate": 0.000188,
+      "loss": 1.2128,
       "step": 20
     },
     {
+      "epoch": 2.0,
+      "learning_rate": 0.00018133333333333334,
+      "loss": 0.3941,
       "step": 30
     },
     {
+      "epoch": 2.67,
+      "learning_rate": 0.00017466666666666667,
+      "loss": 0.1061,
       "step": 40
     },
     {
+      "epoch": 3.33,
+      "learning_rate": 0.000168,
+      "loss": 0.0169,
       "step": 50
     },
     {
+      "epoch": 3.33,
+      "eval_accuracy": 0.8055555555555556,
+      "eval_loss": 0.5319890975952148,
+      "eval_runtime": 1.9752,
+      "eval_samples_per_second": 18.226,
+      "eval_steps_per_second": 2.531,
       "step": 50
     },
     {
+      "epoch": 4.0,
+      "learning_rate": 0.00016133333333333334,
+      "loss": 0.009,
       "step": 60
     },
     {
+      "epoch": 4.67,
+      "learning_rate": 0.00015466666666666667,
+      "loss": 0.0032,
       "step": 70
     },
     {
+      "epoch": 5.33,
+      "learning_rate": 0.000148,
+      "loss": 0.0012,
       "step": 80
     },
     {
+      "epoch": 6.0,
+      "learning_rate": 0.00014133333333333334,
+      "loss": 0.0009,
       "step": 90
     },
     {
+      "epoch": 6.67,
+      "learning_rate": 0.00013466666666666667,
+      "loss": 0.0008,
       "step": 100
     },
     {
+      "epoch": 6.67,
+      "eval_accuracy": 0.9166666666666666,
+      "eval_loss": 0.34849807620048523,
+      "eval_runtime": 1.9712,
+      "eval_samples_per_second": 18.263,
+      "eval_steps_per_second": 2.536,
       "step": 100
     },
     {
+      "epoch": 7.33,
+      "learning_rate": 0.00012800000000000002,
+      "loss": 0.0007,
       "step": 110
     },
     {
+      "epoch": 8.0,
+      "learning_rate": 0.00012133333333333335,
+      "loss": 0.0006,
       "step": 120
     },
     {
+      "epoch": 8.67,
+      "learning_rate": 0.00011466666666666667,
+      "loss": 0.0005,
       "step": 130
     },
     {
+      "epoch": 9.33,
+      "learning_rate": 0.00010800000000000001,
+      "loss": 0.0005,
       "step": 140
     },
     {
+      "epoch": 10.0,
+      "learning_rate": 0.00010133333333333335,
       "loss": 0.0004,
       "step": 150
     },
     {
+      "epoch": 10.0,
+      "eval_accuracy": 0.9444444444444444,
+      "eval_loss": 0.29886576533317566,
+      "eval_runtime": 2.245,
+      "eval_samples_per_second": 16.035,
+      "eval_steps_per_second": 2.227,
       "step": 150
     },
     {
+      "epoch": 10.67,
+      "learning_rate": 9.466666666666667e-05,
       "loss": 0.0004,
       "step": 160
     },
     {
+      "epoch": 11.33,
+      "learning_rate": 8.800000000000001e-05,
+      "loss": 0.0004,
       "step": 170
     },
     {
+      "epoch": 12.0,
+      "learning_rate": 8.133333333333334e-05,
+      "loss": 0.0004,
       "step": 180
     },
     {
+      "epoch": 12.67,
+      "learning_rate": 7.466666666666667e-05,
       "loss": 0.0003,
       "step": 190
     },
     {
+      "epoch": 13.33,
+      "learning_rate": 6.800000000000001e-05,
+      "loss": 0.0004,
       "step": 200
     },
     {
+      "epoch": 13.33,
+      "eval_accuracy": 0.9444444444444444,
+      "eval_loss": 0.29390671849250793,
+      "eval_runtime": 2.0759,
+      "eval_samples_per_second": 17.342,
+      "eval_steps_per_second": 2.409,
       "step": 200
     },
     {
+      "epoch": 14.0,
+      "learning_rate": 6.133333333333334e-05,
       "loss": 0.0003,
       "step": 210
     },
     {
+      "epoch": 14.67,
+      "learning_rate": 5.466666666666666e-05,
       "loss": 0.0003,
       "step": 220
     },
     {
+      "epoch": 15.33,
+      "learning_rate": 4.8e-05,
       "loss": 0.0003,
       "step": 230
     },
     {
+      "epoch": 16.0,
+      "learning_rate": 4.133333333333333e-05,
       "loss": 0.0003,
       "step": 240
     },
     {
+      "epoch": 16.67,
+      "learning_rate": 3.466666666666667e-05,
       "loss": 0.0003,
       "step": 250
     },
     {
+      "epoch": 16.67,
+      "eval_accuracy": 0.9444444444444444,
+      "eval_loss": 0.29294198751449585,
+      "eval_runtime": 1.9452,
+      "eval_samples_per_second": 18.507,
+      "eval_steps_per_second": 2.57,
       "step": 250
     },
     {
+      "epoch": 17.33,
+      "learning_rate": 2.8000000000000003e-05,
       "loss": 0.0003,
       "step": 260
     },
     {
+      "epoch": 18.0,
+      "learning_rate": 2.1333333333333335e-05,
       "loss": 0.0003,
       "step": 270
     },
     {
+      "epoch": 18.67,
+      "learning_rate": 1.4666666666666668e-05,
       "loss": 0.0003,
       "step": 280
     },
+    {
+      "epoch": 19.33,
+      "learning_rate": 8.000000000000001e-06,
+      "loss": 0.0003,
+      "step": 290
+    },
+    {
+      "epoch": 20.0,
+      "learning_rate": 1.3333333333333334e-06,
+      "loss": 0.0003,
+      "step": 300
+    },
+    {
+      "epoch": 20.0,
+      "eval_accuracy": 0.9444444444444444,
+      "eval_loss": 0.29236936569213867,
+      "eval_runtime": 1.9351,
+      "eval_samples_per_second": 18.604,
+      "eval_steps_per_second": 2.584,
+      "step": 300
+    },
     {
       "epoch": 20.0,
+      "step": 300,
+      "total_flos": 9.29987219718144e+16,
+      "train_loss": 0.13472866227229435,
+      "train_runtime": 231.7859,
+      "train_samples_per_second": 5.177,
+      "train_steps_per_second": 1.294
     }
   ],
+  "max_steps": 300,
   "num_train_epochs": 20,
+  "total_flos": 9.29987219718144e+16,
   "trial_name": null,
   "trial_params": null
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c49aa2c0a4b308580ecc8e9ea52b2bab03884419dd31d6c0fc3bf7ba3fc18f2b
 size 3963

 version https://git-lfs.github.com/spec/v1
+oid sha256:505351b249d79638ccd34717b52da9b6f37bbfecf576c89da5d02fadb59a2bc6
 size 3963