Training in progress, epoch 0

Browse files

Files changed (8) hide show

all_results.json +15 -6
eval_results.json +12 -0
model.safetensors +1 -1
runs/May24_16-50-18_RTX3090/events.out.tfevents.1716537217.RTX3090.3776938.1 +3 -0
runs/May24_17-00-00_RTX3090/events.out.tfevents.1716537603.RTX3090.3776938.2 +3 -0
train_results.json +6 -6
trainer_state.json +133 -69
training_args.bin +1 -1

all_results.json CHANGED Viewed

@@ -1,8 +1,17 @@
 {
-    "epoch": 2.873239436619718,
-    "total_flos": 3.244203682433925e+17,
-    "train_loss": 0.3726242260605681,
-    "train_runtime": 73.4486,
-    "train_samples_per_second": 185.517,
-    "train_steps_per_second": 0.694
 }

 {
+    "epoch": 8.571428571428571,
+    "eval_accuracy": 0.9032258064516129,
+    "eval_auc": 0.5,
+    "eval_f1": 0.4745762711864407,
+    "eval_loss": 0.33827999234199524,
+    "eval_precision": 0.9032258064516129,
+    "eval_recall": 1.0,
+    "eval_runtime": 1.0789,
+    "eval_samples_per_second": 172.394,
+    "eval_steps_per_second": 2.781,
+    "total_flos": 1.8691703717363712e+17,
+    "train_loss": 0.28762030601501465,
+    "train_runtime": 70.3105,
+    "train_samples_per_second": 124.59,
+    "train_steps_per_second": 0.427
 }

eval_results.json ADDED Viewed

	@@ -0,0 +1,12 @@

+{
+    "epoch": 8.571428571428571,
+    "eval_accuracy": 0.9032258064516129,
+    "eval_auc": 0.5,
+    "eval_f1": 0.4745762711864407,
+    "eval_loss": 0.33827999234199524,
+    "eval_precision": 0.9032258064516129,
+    "eval_recall": 1.0,
+    "eval_runtime": 1.0789,
+    "eval_samples_per_second": 172.394,
+    "eval_steps_per_second": 2.781
+}

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2123dddc8cf19a8528f3a439ec0602810e134fa81cdd885aa3dc9a71fd8ed159
 size 110342832

 version https://git-lfs.github.com/spec/v1
+oid sha256:1dd2e3b6404034899d709305ce15a3ca43637919f5098d55edd7a72091de6aad
 size 110342832

runs/May24_16-50-18_RTX3090/events.out.tfevents.1716537217.RTX3090.3776938.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:900ffa8fe3f58126fd4674b5a512e1472876aa3ebf308aec6d241ac078b2f0fb
+size 597

runs/May24_17-00-00_RTX3090/events.out.tfevents.1716537603.RTX3090.3776938.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0fd2774dc57b8778ffc6c016d123a3a75522c5892bb087534f10368efa5ed579
+size 5786

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 2.873239436619718,
-    "total_flos": 3.244203682433925e+17,
-    "train_loss": 0.3726242260605681,
-    "train_runtime": 73.4486,
-    "train_samples_per_second": 185.517,
-    "train_steps_per_second": 0.694
 }

 {
+    "epoch": 8.571428571428571,
+    "total_flos": 1.8691703717363712e+17,
+    "train_loss": 0.28762030601501465,
+    "train_runtime": 70.3105,
+    "train_samples_per_second": 124.59,
+    "train_steps_per_second": 0.427
 }

trainer_state.json CHANGED Viewed

@@ -1,101 +1,165 @@
 {
-  "best_metric": 0.8162729658792651,
-  "best_model_checkpoint": "swin-tiny-patch4-window7-224-finetuned-RCC/checkpoint-51",
-  "epoch": 2.873239436619718,
   "eval_steps": 500,
-  "global_step": 51,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.5633802816901409,
-      "grad_norm": 37.96213912963867,
-      "learning_rate": 4.555555555555556e-05,
-      "loss": 0.3224,
       "step": 10
     },
     {
-      "epoch": 0.9577464788732394,
-      "eval_accuracy": 0.6482939632545932,
-      "eval_auc": 0.5379230308475591,
-      "eval_f1": 0.5145158376204106,
-      "eval_loss": 0.6836453080177307,
-      "eval_precision": 0.8498098859315589,
-      "eval_recall": 0.7028301886792453,
-      "eval_runtime": 2.677,
-      "eval_samples_per_second": 284.647,
-      "eval_steps_per_second": 4.483,
       "step": 17
     },
     {
-      "epoch": 1.1267605633802817,
-      "grad_norm": 6.688726902008057,
-      "learning_rate": 3.444444444444445e-05,
-      "loss": 0.3482,
       "step": 20
     },
     {
-      "epoch": 1.6901408450704225,
-      "grad_norm": 3.9382684230804443,
-      "learning_rate": 2.3333333333333336e-05,
-      "loss": 0.3829,
-      "step": 30
     },
     {
-      "epoch": 1.971830985915493,
-      "eval_accuracy": 0.8044619422572179,
-      "eval_auc": 0.5201033243486074,
-      "eval_f1": 0.5142198243219538,
-      "eval_loss": 0.48597800731658936,
-      "eval_precision": 0.8405594405594405,
-      "eval_recall": 0.9449685534591195,
-      "eval_runtime": 2.6435,
-      "eval_samples_per_second": 288.253,
-      "eval_steps_per_second": 4.539,
-      "step": 35
     },
     {
-      "epoch": 2.2535211267605635,
-      "grad_norm": 3.417764186859131,
-      "learning_rate": 1.2222222222222222e-05,
-      "loss": 0.405,
-      "step": 40
     },
     {
-      "epoch": 2.816901408450704,
-      "grad_norm": 4.870389461517334,
-      "learning_rate": 1.1111111111111112e-06,
-      "loss": 0.4052,
-      "step": 50
     },
     {
-      "epoch": 2.873239436619718,
-      "eval_accuracy": 0.8162729658792651,
-      "eval_auc": 0.5208146151542379,
-      "eval_f1": 0.5111803519061584,
-      "eval_loss": 0.48757827281951904,
-      "eval_precision": 0.8406593406593407,
-      "eval_recall": 0.9622641509433962,
-      "eval_runtime": 2.7101,
-      "eval_samples_per_second": 281.168,
-      "eval_steps_per_second": 4.428,
-      "step": 51
     },
     {
-      "epoch": 2.873239436619718,
-      "step": 51,
-      "total_flos": 3.244203682433925e+17,
-      "train_loss": 0.3726242260605681,
-      "train_runtime": 73.4486,
-      "train_samples_per_second": 185.517,
-      "train_steps_per_second": 0.694
     }
   ],
   "logging_steps": 10,
-  "max_steps": 51,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 3,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
@@ -109,7 +173,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 3.244203682433925e+17,
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 0.9032258064516129,
+  "best_model_checkpoint": "swin-tiny-patch4-window7-224-finetuned-RCC/checkpoint-3",
+  "epoch": 8.571428571428571,
   "eval_steps": 500,
+  "global_step": 30,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.8571428571428571,
+      "eval_accuracy": 0.9032258064516129,
+      "eval_auc": 0.5,
+      "eval_f1": 0.4745762711864407,
+      "eval_loss": 0.33827999234199524,
+      "eval_precision": 0.9032258064516129,
+      "eval_recall": 1.0,
+      "eval_runtime": 1.0242,
+      "eval_samples_per_second": 181.602,
+      "eval_steps_per_second": 2.929,
+      "step": 3
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.9032258064516129,
+      "eval_auc": 0.5,
+      "eval_f1": 0.4745762711864407,
+      "eval_loss": 0.3653673529624939,
+      "eval_precision": 0.9032258064516129,
+      "eval_recall": 1.0,
+      "eval_runtime": 1.0375,
+      "eval_samples_per_second": 179.274,
+      "eval_steps_per_second": 2.892,
+      "step": 7
+    },
+    {
+      "epoch": 2.857142857142857,
+      "grad_norm": 4.537749767303467,
+      "learning_rate": 3.7037037037037037e-05,
+      "loss": 0.3833,
+      "step": 10
+    },
+    {
+      "epoch": 2.857142857142857,
+      "eval_accuracy": 0.9032258064516129,
+      "eval_auc": 0.5,
+      "eval_f1": 0.4745762711864407,
+      "eval_loss": 0.3421719968318939,
+      "eval_precision": 0.9032258064516129,
+      "eval_recall": 1.0,
+      "eval_runtime": 1.0114,
+      "eval_samples_per_second": 183.911,
+      "eval_steps_per_second": 2.966,
       "step": 10
     },
     {
+      "epoch": 4.0,
+      "eval_accuracy": 0.9032258064516129,
+      "eval_auc": 0.5,
+      "eval_f1": 0.4745762711864407,
+      "eval_loss": 0.3555563986301422,
+      "eval_precision": 0.9032258064516129,
+      "eval_recall": 1.0,
+      "eval_runtime": 1.0242,
+      "eval_samples_per_second": 181.606,
+      "eval_steps_per_second": 2.929,
+      "step": 14
+    },
+    {
+      "epoch": 4.857142857142857,
+      "eval_accuracy": 0.9032258064516129,
+      "eval_auc": 0.5,
+      "eval_f1": 0.4745762711864407,
+      "eval_loss": 0.3424948453903198,
+      "eval_precision": 0.9032258064516129,
+      "eval_recall": 1.0,
+      "eval_runtime": 1.0046,
+      "eval_samples_per_second": 185.14,
+      "eval_steps_per_second": 2.986,
       "step": 17
     },
     {
+      "epoch": 5.714285714285714,
+      "grad_norm": 1.4052001237869263,
+      "learning_rate": 1.8518518518518518e-05,
+      "loss": 0.2492,
       "step": 20
     },
     {
+      "epoch": 6.0,
+      "eval_accuracy": 0.9032258064516129,
+      "eval_auc": 0.5,
+      "eval_f1": 0.4745762711864407,
+      "eval_loss": 0.3400775194168091,
+      "eval_precision": 0.9032258064516129,
+      "eval_recall": 1.0,
+      "eval_runtime": 1.0288,
+      "eval_samples_per_second": 180.792,
+      "eval_steps_per_second": 2.916,
+      "step": 21
     },
     {
+      "epoch": 6.857142857142857,
+      "eval_accuracy": 0.9032258064516129,
+      "eval_auc": 0.5,
+      "eval_f1": 0.4745762711864407,
+      "eval_loss": 0.35429030656814575,
+      "eval_precision": 0.9032258064516129,
+      "eval_recall": 1.0,
+      "eval_runtime": 0.999,
+      "eval_samples_per_second": 186.195,
+      "eval_steps_per_second": 3.003,
+      "step": 24
     },
     {
+      "epoch": 8.0,
+      "eval_accuracy": 0.9032258064516129,
+      "eval_auc": 0.5,
+      "eval_f1": 0.4745762711864407,
+      "eval_loss": 0.3571774363517761,
+      "eval_precision": 0.9032258064516129,
+      "eval_recall": 1.0,
+      "eval_runtime": 1.0317,
+      "eval_samples_per_second": 180.286,
+      "eval_steps_per_second": 2.908,
+      "step": 28
     },
     {
+      "epoch": 8.571428571428571,
+      "grad_norm": 1.283613920211792,
+      "learning_rate": 0.0,
+      "loss": 0.2304,
+      "step": 30
     },
     {
+      "epoch": 8.571428571428571,
+      "eval_accuracy": 0.9032258064516129,
+      "eval_auc": 0.5,
+      "eval_f1": 0.4745762711864407,
+      "eval_loss": 0.35649099946022034,
+      "eval_precision": 0.9032258064516129,
+      "eval_recall": 1.0,
+      "eval_runtime": 1.006,
+      "eval_samples_per_second": 184.89,
+      "eval_steps_per_second": 2.982,
+      "step": 30
     },
     {
+      "epoch": 8.571428571428571,
+      "step": 30,
+      "total_flos": 1.8691703717363712e+17,
+      "train_loss": 0.28762030601501465,
+      "train_runtime": 70.3105,
+      "train_samples_per_second": 124.59,
+      "train_steps_per_second": 0.427
     }
   ],
   "logging_steps": 10,
+  "max_steps": 30,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
       "attributes": {}
     }
   },
+  "total_flos": 1.8691703717363712e+17,
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": null

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3b51c58804bde30d77029103e316923288b7e152ac500fbd62212b7d62e90453
 size 4731

 version https://git-lfs.github.com/spec/v1
+oid sha256:5d4c5476f8f49bfc14a67ca98ff73785fd0e5765eba1ff25ad649cd22bc6aaea
 size 4731