polejowska
/

cdetr-mist1-brain-gt-tumors-8ah-6l

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [microsoft/conditional-detr-resnet-50](https://huggingface.co/microsoft/conditional-detr-resnet-50) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 2.8917
 ## Model description
@@ -40,7 +40,7 @@ The following hyperparameters were used during training:
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 25
 - mixed_precision_training: Native AMP
 ### Training results
@@ -70,8 +70,33 @@ The following hyperparameters were used during training:
 | 3.0847        | 21.0  | 2415 | 2.9321          |
 | 3.0333        | 22.0  | 2530 | 2.9128          |
 | 3.0126        | 23.0  | 2645 | 2.8627          |
-| 2.9701        | 24.0  | 2760 | 2.8686          |
-| 2.9964        | 25.0  | 2875 | 2.8917          |
 ### Framework versions

 This model is a fine-tuned version of [microsoft/conditional-detr-resnet-50](https://huggingface.co/microsoft/conditional-detr-resnet-50) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 2.8303
 ## Model description
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 50
 - mixed_precision_training: Native AMP
 ### Training results
 | 3.0847        | 21.0  | 2415 | 2.9321          |
 | 3.0333        | 22.0  | 2530 | 2.9128          |
 | 3.0126        | 23.0  | 2645 | 2.8627          |
+| 2.9968        | 24.0  | 2760 | 3.0186          |
+| 3.0295        | 25.0  | 2875 | 3.0148          |
+| 3.0294        | 26.0  | 2990 | 3.0341          |
+| 3.0395        | 27.0  | 3105 | 2.9997          |
+| 3.0445        | 28.0  | 3220 | 3.0575          |
+| 2.9761        | 29.0  | 3335 | 2.9707          |
+| 3.0075        | 30.0  | 3450 | 2.9392          |
+| 3.0198        | 31.0  | 3565 | 2.9122          |
+| 2.9782        | 32.0  | 3680 | 2.9471          |
+| 2.9773        | 33.0  | 3795 | 3.0306          |
+| 2.9528        | 34.0  | 3910 | 2.8513          |
+| 2.9228        | 35.0  | 4025 | 2.8997          |
+| 2.9221        | 36.0  | 4140 | 2.8646          |
+| 2.8933        | 37.0  | 4255 | 2.8871          |
+| 2.8925        | 38.0  | 4370 | 2.9407          |
+| 2.9069        | 39.0  | 4485 | 2.9625          |
+| 2.9246        | 40.0  | 4600 | 2.9946          |
+| 2.9089        | 41.0  | 4715 | 2.8936          |
+| 2.8573        | 42.0  | 4830 | 2.8272          |
+| 2.8378        | 43.0  | 4945 | 2.8543          |
+| 2.8957        | 44.0  | 5060 | 2.8590          |
+| 2.8454        | 45.0  | 5175 | 2.8525          |
+| 2.7964        | 46.0  | 5290 | 2.8658          |
+| 2.8172        | 47.0  | 5405 | 2.8872          |
+| 2.8472        | 48.0  | 5520 | 2.8654          |
+| 2.811         | 49.0  | 5635 | 2.8572          |
+| 2.801         | 50.0  | 5750 | 2.8303          |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e390f6a4ae2b3215d085ff2daf2b6651510ac5858a878871ea4e4c46f915d3ed
 size 173870884

 version https://git-lfs.github.com/spec/v1
+oid sha256:79e5d32da4245509b017fc3052add7ff321633c4ad8033144e685fcd78b1f3c8
 size 173870884

trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-  "best_metric": 2.8627383708953857,
-  "best_model_checkpoint": "cdetr-mist1-brain-gt-tumors-8ah-6l/checkpoint-2645",
-  "epoch": 25.0,
   "eval_steps": 500,
-  "global_step": 2875,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -332,47 +332,397 @@
     },
     {
       "epoch": 24.0,
-      "learning_rate": 4.382608695652174e-07,
-      "loss": 2.9701,
       "step": 2760
     },
     {
       "epoch": 24.0,
-      "eval_loss": 2.868567705154419,
-      "eval_runtime": 6.0333,
-      "eval_samples_per_second": 6.63,
-      "eval_steps_per_second": 0.829,
       "step": 2760
     },
     {
       "epoch": 25.0,
-      "learning_rate": 3.82608695652174e-08,
-      "loss": 2.9964,
       "step": 2875
     },
     {
       "epoch": 25.0,
-      "eval_loss": 2.8917393684387207,
-      "eval_runtime": 6.0377,
-      "eval_samples_per_second": 6.625,
-      "eval_steps_per_second": 0.828,
       "step": 2875
     },
     {
-      "epoch": 25.0,
-      "step": 2875,
-      "total_flos": 5.73883103808e+18,
-      "train_loss": 3.3358317977241847,
-      "train_runtime": 2483.4302,
-      "train_samples_per_second": 4.631,
-      "train_steps_per_second": 1.158
     }
   ],
   "logging_steps": 500,
-  "max_steps": 2875,
-  "num_train_epochs": 25,
   "save_steps": 500,
-  "total_flos": 5.73883103808e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 2.827199935913086,
+  "best_model_checkpoint": "cdetr-mist1-brain-gt-tumors-8ah-6l/checkpoint-4830",
+  "epoch": 50.0,
   "eval_steps": 500,
+  "global_step": 5750,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
     },
     {
       "epoch": 24.0,
+      "learning_rate": 5.234782608695652e-06,
+      "loss": 2.9968,
       "step": 2760
     },
     {
       "epoch": 24.0,
+      "eval_loss": 3.0186123847961426,
+      "eval_runtime": 5.7749,
+      "eval_samples_per_second": 6.926,
+      "eval_steps_per_second": 0.866,
       "step": 2760
     },
     {
       "epoch": 25.0,
+      "learning_rate": 5.036521739130436e-06,
+      "loss": 3.0295,
       "step": 2875
     },
     {
       "epoch": 25.0,
+      "eval_loss": 3.0147616863250732,
+      "eval_runtime": 5.799,
+      "eval_samples_per_second": 6.898,
+      "eval_steps_per_second": 0.862,
       "step": 2875
     },
     {
+      "epoch": 26.0,
+      "learning_rate": 4.836521739130435e-06,
+      "loss": 3.0294,
+      "step": 2990
+    },
+    {
+      "epoch": 26.0,
+      "eval_loss": 3.034066915512085,
+      "eval_runtime": 5.8474,
+      "eval_samples_per_second": 6.841,
+      "eval_steps_per_second": 0.855,
+      "step": 2990
+    },
+    {
+      "epoch": 27.0,
+      "learning_rate": 4.636521739130435e-06,
+      "loss": 3.0395,
+      "step": 3105
+    },
+    {
+      "epoch": 27.0,
+      "eval_loss": 2.99969220161438,
+      "eval_runtime": 5.7579,
+      "eval_samples_per_second": 6.947,
+      "eval_steps_per_second": 0.868,
+      "step": 3105
+    },
+    {
+      "epoch": 28.0,
+      "learning_rate": 4.436521739130435e-06,
+      "loss": 3.0445,
+      "step": 3220
+    },
+    {
+      "epoch": 28.0,
+      "eval_loss": 3.0574753284454346,
+      "eval_runtime": 5.6888,
+      "eval_samples_per_second": 7.031,
+      "eval_steps_per_second": 0.879,
+      "step": 3220
+    },
+    {
+      "epoch": 29.0,
+      "learning_rate": 4.236521739130436e-06,
+      "loss": 2.9761,
+      "step": 3335
+    },
+    {
+      "epoch": 29.0,
+      "eval_loss": 2.97066068649292,
+      "eval_runtime": 5.7458,
+      "eval_samples_per_second": 6.962,
+      "eval_steps_per_second": 0.87,
+      "step": 3335
+    },
+    {
+      "epoch": 30.0,
+      "learning_rate": 4.038260869565218e-06,
+      "loss": 3.0075,
+      "step": 3450
+    },
+    {
+      "epoch": 30.0,
+      "eval_loss": 2.939246416091919,
+      "eval_runtime": 5.722,
+      "eval_samples_per_second": 6.991,
+      "eval_steps_per_second": 0.874,
+      "step": 3450
+    },
+    {
+      "epoch": 31.0,
+      "learning_rate": 3.838260869565218e-06,
+      "loss": 3.0198,
+      "step": 3565
+    },
+    {
+      "epoch": 31.0,
+      "eval_loss": 2.9121549129486084,
+      "eval_runtime": 5.8674,
+      "eval_samples_per_second": 6.817,
+      "eval_steps_per_second": 0.852,
+      "step": 3565
+    },
+    {
+      "epoch": 32.0,
+      "learning_rate": 3.6382608695652177e-06,
+      "loss": 2.9782,
+      "step": 3680
+    },
+    {
+      "epoch": 32.0,
+      "eval_loss": 2.947079658508301,
+      "eval_runtime": 5.7346,
+      "eval_samples_per_second": 6.975,
+      "eval_steps_per_second": 0.872,
+      "step": 3680
+    },
+    {
+      "epoch": 33.0,
+      "learning_rate": 3.4382608695652175e-06,
+      "loss": 2.9773,
+      "step": 3795
+    },
+    {
+      "epoch": 33.0,
+      "eval_loss": 3.030561923980713,
+      "eval_runtime": 5.7197,
+      "eval_samples_per_second": 6.993,
+      "eval_steps_per_second": 0.874,
+      "step": 3795
+    },
+    {
+      "epoch": 34.0,
+      "learning_rate": 3.2382608695652177e-06,
+      "loss": 2.9528,
+      "step": 3910
+    },
+    {
+      "epoch": 34.0,
+      "eval_loss": 2.8513386249542236,
+      "eval_runtime": 5.6599,
+      "eval_samples_per_second": 7.067,
+      "eval_steps_per_second": 0.883,
+      "step": 3910
+    },
+    {
+      "epoch": 35.0,
+      "learning_rate": 3.038260869565218e-06,
+      "loss": 2.9228,
+      "step": 4025
+    },
+    {
+      "epoch": 35.0,
+      "eval_loss": 2.899709701538086,
+      "eval_runtime": 5.6812,
+      "eval_samples_per_second": 7.041,
+      "eval_steps_per_second": 0.88,
+      "step": 4025
+    },
+    {
+      "epoch": 36.0,
+      "learning_rate": 2.8382608695652177e-06,
+      "loss": 2.9221,
+      "step": 4140
+    },
+    {
+      "epoch": 36.0,
+      "eval_loss": 2.8646340370178223,
+      "eval_runtime": 5.6561,
+      "eval_samples_per_second": 7.072,
+      "eval_steps_per_second": 0.884,
+      "step": 4140
+    },
+    {
+      "epoch": 37.0,
+      "learning_rate": 2.638260869565218e-06,
+      "loss": 2.8933,
+      "step": 4255
+    },
+    {
+      "epoch": 37.0,
+      "eval_loss": 2.8870697021484375,
+      "eval_runtime": 5.7007,
+      "eval_samples_per_second": 7.017,
+      "eval_steps_per_second": 0.877,
+      "step": 4255
+    },
+    {
+      "epoch": 38.0,
+      "learning_rate": 2.4382608695652177e-06,
+      "loss": 2.8925,
+      "step": 4370
+    },
+    {
+      "epoch": 38.0,
+      "eval_loss": 2.94067120552063,
+      "eval_runtime": 5.6567,
+      "eval_samples_per_second": 7.071,
+      "eval_steps_per_second": 0.884,
+      "step": 4370
+    },
+    {
+      "epoch": 39.0,
+      "learning_rate": 2.2382608695652175e-06,
+      "loss": 2.9069,
+      "step": 4485
+    },
+    {
+      "epoch": 39.0,
+      "eval_loss": 2.9625325202941895,
+      "eval_runtime": 5.6615,
+      "eval_samples_per_second": 7.065,
+      "eval_steps_per_second": 0.883,
+      "step": 4485
+    },
+    {
+      "epoch": 40.0,
+      "learning_rate": 2.0382608695652177e-06,
+      "loss": 2.9246,
+      "step": 4600
+    },
+    {
+      "epoch": 40.0,
+      "eval_loss": 2.994633197784424,
+      "eval_runtime": 5.6894,
+      "eval_samples_per_second": 7.031,
+      "eval_steps_per_second": 0.879,
+      "step": 4600
+    },
+    {
+      "epoch": 41.0,
+      "learning_rate": 1.8382608695652178e-06,
+      "loss": 2.9089,
+      "step": 4715
+    },
+    {
+      "epoch": 41.0,
+      "eval_loss": 2.8935651779174805,
+      "eval_runtime": 5.7226,
+      "eval_samples_per_second": 6.99,
+      "eval_steps_per_second": 0.874,
+      "step": 4715
+    },
+    {
+      "epoch": 42.0,
+      "learning_rate": 1.6382608695652176e-06,
+      "loss": 2.8573,
+      "step": 4830
+    },
+    {
+      "epoch": 42.0,
+      "eval_loss": 2.827199935913086,
+      "eval_runtime": 5.6411,
+      "eval_samples_per_second": 7.091,
+      "eval_steps_per_second": 0.886,
+      "step": 4830
+    },
+    {
+      "epoch": 43.0,
+      "learning_rate": 1.4382608695652176e-06,
+      "loss": 2.8378,
+      "step": 4945
+    },
+    {
+      "epoch": 43.0,
+      "eval_loss": 2.8543009757995605,
+      "eval_runtime": 5.6643,
+      "eval_samples_per_second": 7.062,
+      "eval_steps_per_second": 0.883,
+      "step": 4945
+    },
+    {
+      "epoch": 44.0,
+      "learning_rate": 1.2382608695652176e-06,
+      "loss": 2.8957,
+      "step": 5060
+    },
+    {
+      "epoch": 44.0,
+      "eval_loss": 2.859046459197998,
+      "eval_runtime": 5.687,
+      "eval_samples_per_second": 7.034,
+      "eval_steps_per_second": 0.879,
+      "step": 5060
+    },
+    {
+      "epoch": 45.0,
+      "learning_rate": 1.0382608695652174e-06,
+      "loss": 2.8454,
+      "step": 5175
+    },
+    {
+      "epoch": 45.0,
+      "eval_loss": 2.8524787425994873,
+      "eval_runtime": 5.6623,
+      "eval_samples_per_second": 7.064,
+      "eval_steps_per_second": 0.883,
+      "step": 5175
+    },
+    {
+      "epoch": 46.0,
+      "learning_rate": 8.382608695652175e-07,
+      "loss": 2.7964,
+      "step": 5290
+    },
+    {
+      "epoch": 46.0,
+      "eval_loss": 2.8657748699188232,
+      "eval_runtime": 5.6625,
+      "eval_samples_per_second": 7.064,
+      "eval_steps_per_second": 0.883,
+      "step": 5290
+    },
+    {
+      "epoch": 47.0,
+      "learning_rate": 6.382608695652175e-07,
+      "loss": 2.8172,
+      "step": 5405
+    },
+    {
+      "epoch": 47.0,
+      "eval_loss": 2.8872039318084717,
+      "eval_runtime": 5.6798,
+      "eval_samples_per_second": 7.043,
+      "eval_steps_per_second": 0.88,
+      "step": 5405
+    },
+    {
+      "epoch": 48.0,
+      "learning_rate": 4.382608695652174e-07,
+      "loss": 2.8472,
+      "step": 5520
+    },
+    {
+      "epoch": 48.0,
+      "eval_loss": 2.8653695583343506,
+      "eval_runtime": 5.6595,
+      "eval_samples_per_second": 7.068,
+      "eval_steps_per_second": 0.883,
+      "step": 5520
+    },
+    {
+      "epoch": 49.0,
+      "learning_rate": 2.3826086956521743e-07,
+      "loss": 2.811,
+      "step": 5635
+    },
+    {
+      "epoch": 49.0,
+      "eval_loss": 2.8571643829345703,
+      "eval_runtime": 5.7272,
+      "eval_samples_per_second": 6.984,
+      "eval_steps_per_second": 0.873,
+      "step": 5635
+    },
+    {
+      "epoch": 50.0,
+      "learning_rate": 3.82608695652174e-08,
+      "loss": 2.801,
+      "step": 5750
+    },
+    {
+      "epoch": 50.0,
+      "eval_loss": 2.830277919769287,
+      "eval_runtime": 5.6412,
+      "eval_samples_per_second": 7.091,
+      "eval_steps_per_second": 0.886,
+      "step": 5750
+    },
+    {
+      "epoch": 50.0,
+      "step": 5750,
+      "total_flos": 1.147766207616e+19,
+      "train_loss": 1.5786318518597147,
+      "train_runtime": 2642.836,
+      "train_samples_per_second": 8.703,
+      "train_steps_per_second": 2.176
     }
   ],
   "logging_steps": 500,
+  "max_steps": 5750,
+  "num_train_epochs": 50,
   "save_steps": 500,
+  "total_flos": 1.147766207616e+19,
   "trial_name": null,
   "trial_params": null
 }