polejowska
/

detr-r50-finetuned-mist1-gb-4ah-6l

+---
+license: apache-2.0
+base_model: polejowska/detr-r50-cd45rb-8ah-6l
+tags:
+- generated_from_trainer
+model-index:
+- name: detr-r50-finetuned-mist1-gb-4ah-6l
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# detr-r50-finetuned-mist1-gb-4ah-6l
+This model is a fine-tuned version of [polejowska/detr-r50-cd45rb-8ah-6l](https://huggingface.co/polejowska/detr-r50-cd45rb-8ah-6l) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 2.2166
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 1e-05
+- train_batch_size: 4
+- eval_batch_size: 8
+- seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- num_epochs: 50
+- mixed_precision_training: Native AMP
+### Training results
+| Training Loss | Epoch | Step | Validation Loss |
+|:-------------:|:-----:|:----:|:---------------:|
+| 3.4044        | 1.0   | 115  | 3.0048          |
+| 3.1708        | 2.0   | 230  | 2.9028          |
+| 3.0756        | 3.0   | 345  | 2.8538          |
+| 2.9769        | 4.0   | 460  | 2.8149          |
+| 2.8999        | 5.0   | 575  | 2.7332          |
+| 2.8609        | 6.0   | 690  | 2.7212          |
+| 2.8338        | 7.0   | 805  | 2.6894          |
+| 2.8103        | 8.0   | 920  | 2.7045          |
+| 2.8036        | 9.0   | 1035 | 2.7786          |
+| 2.7486        | 10.0  | 1150 | 2.6881          |
+| 2.7076        | 11.0  | 1265 | 2.6059          |
+| 2.7156        | 12.0  | 1380 | 2.6483          |
+| 2.6655        | 13.0  | 1495 | 2.5438          |
+| 2.6368        | 14.0  | 1610 | 2.5342          |
+| 2.5982        | 15.0  | 1725 | 2.5287          |
+| 2.6116        | 16.0  | 1840 | 2.4446          |
+| 2.5592        | 17.0  | 1955 | 2.4365          |
+| 2.5528        | 18.0  | 2070 | 2.4844          |
+| 2.5248        | 19.0  | 2185 | 2.4195          |
+| 2.4853        | 20.0  | 2300 | 2.4538          |
+| 2.5295        | 21.0  | 2415 | 2.5696          |
+| 2.5069        | 22.0  | 2530 | 2.4537          |
+| 2.4504        | 23.0  | 2645 | 2.5152          |
+| 2.4447        | 24.0  | 2760 | 2.4432          |
+| 2.4303        | 25.0  | 2875 | 2.4033          |
+| 2.4137        | 26.0  | 2990 | 2.3796          |
+| 2.41          | 27.0  | 3105 | 2.3599          |
+| 2.3816        | 28.0  | 3220 | 2.4018          |
+| 2.3752        | 29.0  | 3335 | 2.3116          |
+| 2.3929        | 30.0  | 3450 | 2.3105          |
+| 2.3791        | 31.0  | 3565 | 2.3677          |
+| 2.3639        | 32.0  | 3680 | 2.4312          |
+| 2.3475        | 33.0  | 3795 | 2.3052          |
+| 2.3429        | 34.0  | 3910 | 2.3222          |
+| 2.3115        | 35.0  | 4025 | 2.3126          |
+| 2.3276        | 36.0  | 4140 | 2.3154          |
+| 2.3126        | 37.0  | 4255 | 2.3534          |
+| 2.2934        | 38.0  | 4370 | 2.2566          |
+| 2.2901        | 39.0  | 4485 | 2.2748          |
+| 2.2622        | 40.0  | 4600 | 2.2620          |
+| 2.2707        | 41.0  | 4715 | 2.2336          |
+| 2.2338        | 42.0  | 4830 | 2.2242          |
+| 2.2457        | 43.0  | 4945 | 2.2192          |
+| 2.227         | 44.0  | 5060 | 2.2067          |
+| 2.2215        | 45.0  | 5175 | 2.2183          |
+| 2.2075        | 46.0  | 5290 | 2.2188          |
+| 2.2286        | 47.0  | 5405 | 2.2306          |
+| 2.2292        | 48.0  | 5520 | 2.2160          |
+| 2.219         | 49.0  | 5635 | 2.2208          |
+| 2.2125        | 50.0  | 5750 | 2.2166          |
+### Framework versions
+- Transformers 4.35.0
+- Pytorch 2.0.0
+- Datasets 2.1.0
+- Tokenizers 0.14.1

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5ed072fa2cca0dcdc10375b7378622f74a0935cb2df6a96adc34d911830b8788
 size 166494824

 version https://git-lfs.github.com/spec/v1
+oid sha256:03a13c67ec7bcd25ca536198d4cc57900ecebbaac67ad5332b4775a08051119b
 size 166494824

trainer_state.json ADDED Viewed

	@@ -0,0 +1,728 @@

+{
+  "best_metric": 2.206695079803467,
+  "best_model_checkpoint": "detr-r50-finetuned-mist1-gb-4ah-6l/checkpoint-5060",
+  "epoch": 50.0,
+  "eval_steps": 500,
+  "global_step": 5750,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 9.812173913043479e-06,
+      "loss": 3.4044,
+      "step": 115
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 3.004835844039917,
+      "eval_runtime": 5.8385,
+      "eval_samples_per_second": 6.851,
+      "eval_steps_per_second": 0.856,
+      "step": 115
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 9.612173913043479e-06,
+      "loss": 3.1708,
+      "step": 230
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 2.902806520462036,
+      "eval_runtime": 5.7867,
+      "eval_samples_per_second": 6.912,
+      "eval_steps_per_second": 0.864,
+      "step": 230
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 9.412173913043479e-06,
+      "loss": 3.0756,
+      "step": 345
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 2.853818416595459,
+      "eval_runtime": 5.8759,
+      "eval_samples_per_second": 6.808,
+      "eval_steps_per_second": 0.851,
+      "step": 345
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 9.21217391304348e-06,
+      "loss": 2.9769,
+      "step": 460
+    },
+    {
+      "epoch": 4.0,
+      "eval_loss": 2.814894914627075,
+      "eval_runtime": 5.8445,
+      "eval_samples_per_second": 6.844,
+      "eval_steps_per_second": 0.855,
+      "step": 460
+    },
+    {
+      "epoch": 5.0,
+      "learning_rate": 9.01217391304348e-06,
+      "loss": 2.8999,
+      "step": 575
+    },
+    {
+      "epoch": 5.0,
+      "eval_loss": 2.7331762313842773,
+      "eval_runtime": 5.9217,
+      "eval_samples_per_second": 6.755,
+      "eval_steps_per_second": 0.844,
+      "step": 575
+    },
+    {
+      "epoch": 6.0,
+      "learning_rate": 8.81217391304348e-06,
+      "loss": 2.8609,
+      "step": 690
+    },
+    {
+      "epoch": 6.0,
+      "eval_loss": 2.7212414741516113,
+      "eval_runtime": 5.879,
+      "eval_samples_per_second": 6.804,
+      "eval_steps_per_second": 0.85,
+      "step": 690
+    },
+    {
+      "epoch": 7.0,
+      "learning_rate": 8.613913043478262e-06,
+      "loss": 2.8338,
+      "step": 805
+    },
+    {
+      "epoch": 7.0,
+      "eval_loss": 2.689382553100586,
+      "eval_runtime": 5.8299,
+      "eval_samples_per_second": 6.861,
+      "eval_steps_per_second": 0.858,
+      "step": 805
+    },
+    {
+      "epoch": 8.0,
+      "learning_rate": 8.413913043478262e-06,
+      "loss": 2.8103,
+      "step": 920
+    },
+    {
+      "epoch": 8.0,
+      "eval_loss": 2.704505681991577,
+      "eval_runtime": 5.7873,
+      "eval_samples_per_second": 6.912,
+      "eval_steps_per_second": 0.864,
+      "step": 920
+    },
+    {
+      "epoch": 9.0,
+      "learning_rate": 8.21391304347826e-06,
+      "loss": 2.8036,
+      "step": 1035
+    },
+    {
+      "epoch": 9.0,
+      "eval_loss": 2.778614044189453,
+      "eval_runtime": 5.7444,
+      "eval_samples_per_second": 6.963,
+      "eval_steps_per_second": 0.87,
+      "step": 1035
+    },
+    {
+      "epoch": 10.0,
+      "learning_rate": 8.013913043478262e-06,
+      "loss": 2.7486,
+      "step": 1150
+    },
+    {
+      "epoch": 10.0,
+      "eval_loss": 2.688080310821533,
+      "eval_runtime": 5.7616,
+      "eval_samples_per_second": 6.943,
+      "eval_steps_per_second": 0.868,
+      "step": 1150
+    },
+    {
+      "epoch": 11.0,
+      "learning_rate": 7.813913043478263e-06,
+      "loss": 2.7076,
+      "step": 1265
+    },
+    {
+      "epoch": 11.0,
+      "eval_loss": 2.605870485305786,
+      "eval_runtime": 5.8415,
+      "eval_samples_per_second": 6.848,
+      "eval_steps_per_second": 0.856,
+      "step": 1265
+    },
+    {
+      "epoch": 12.0,
+      "learning_rate": 7.615652173913044e-06,
+      "loss": 2.7156,
+      "step": 1380
+    },
+    {
+      "epoch": 12.0,
+      "eval_loss": 2.648322343826294,
+      "eval_runtime": 5.8314,
+      "eval_samples_per_second": 6.859,
+      "eval_steps_per_second": 0.857,
+      "step": 1380
+    },
+    {
+      "epoch": 13.0,
+      "learning_rate": 7.415652173913044e-06,
+      "loss": 2.6655,
+      "step": 1495
+    },
+    {
+      "epoch": 13.0,
+      "eval_loss": 2.5438005924224854,
+      "eval_runtime": 5.7667,
+      "eval_samples_per_second": 6.936,
+      "eval_steps_per_second": 0.867,
+      "step": 1495
+    },
+    {
+      "epoch": 14.0,
+      "learning_rate": 7.215652173913043e-06,
+      "loss": 2.6368,
+      "step": 1610
+    },
+    {
+      "epoch": 14.0,
+      "eval_loss": 2.5342297554016113,
+      "eval_runtime": 5.7673,
+      "eval_samples_per_second": 6.936,
+      "eval_steps_per_second": 0.867,
+      "step": 1610
+    },
+    {
+      "epoch": 15.0,
+      "learning_rate": 7.015652173913044e-06,
+      "loss": 2.5982,
+      "step": 1725
+    },
+    {
+      "epoch": 15.0,
+      "eval_loss": 2.5287182331085205,
+      "eval_runtime": 5.8321,
+      "eval_samples_per_second": 6.859,
+      "eval_steps_per_second": 0.857,
+      "step": 1725
+    },
+    {
+      "epoch": 16.0,
+      "learning_rate": 6.815652173913045e-06,
+      "loss": 2.6116,
+      "step": 1840
+    },
+    {
+      "epoch": 16.0,
+      "eval_loss": 2.4446094036102295,
+      "eval_runtime": 5.7529,
+      "eval_samples_per_second": 6.953,
+      "eval_steps_per_second": 0.869,
+      "step": 1840
+    },
+    {
+      "epoch": 17.0,
+      "learning_rate": 6.615652173913044e-06,
+      "loss": 2.5592,
+      "step": 1955
+    },
+    {
+      "epoch": 17.0,
+      "eval_loss": 2.4365103244781494,
+      "eval_runtime": 5.7499,
+      "eval_samples_per_second": 6.957,
+      "eval_steps_per_second": 0.87,
+      "step": 1955
+    },
+    {
+      "epoch": 18.0,
+      "learning_rate": 6.415652173913044e-06,
+      "loss": 2.5528,
+      "step": 2070
+    },
+    {
+      "epoch": 18.0,
+      "eval_loss": 2.484395980834961,
+      "eval_runtime": 5.7801,
+      "eval_samples_per_second": 6.92,
+      "eval_steps_per_second": 0.865,
+      "step": 2070
+    },
+    {
+      "epoch": 19.0,
+      "learning_rate": 6.215652173913044e-06,
+      "loss": 2.5248,
+      "step": 2185
+    },
+    {
+      "epoch": 19.0,
+      "eval_loss": 2.4194891452789307,
+      "eval_runtime": 5.7656,
+      "eval_samples_per_second": 6.938,
+      "eval_steps_per_second": 0.867,
+      "step": 2185
+    },
+    {
+      "epoch": 20.0,
+      "learning_rate": 6.015652173913044e-06,
+      "loss": 2.4853,
+      "step": 2300
+    },
+    {
+      "epoch": 20.0,
+      "eval_loss": 2.453843832015991,
+      "eval_runtime": 5.8034,
+      "eval_samples_per_second": 6.893,
+      "eval_steps_per_second": 0.862,
+      "step": 2300
+    },
+    {
+      "epoch": 21.0,
+      "learning_rate": 5.815652173913045e-06,
+      "loss": 2.5295,
+      "step": 2415
+    },
+    {
+      "epoch": 21.0,
+      "eval_loss": 2.569608211517334,
+      "eval_runtime": 5.8097,
+      "eval_samples_per_second": 6.885,
+      "eval_steps_per_second": 0.861,
+      "step": 2415
+    },
+    {
+      "epoch": 22.0,
+      "learning_rate": 5.615652173913044e-06,
+      "loss": 2.5069,
+      "step": 2530
+    },
+    {
+      "epoch": 22.0,
+      "eval_loss": 2.4536538124084473,
+      "eval_runtime": 5.7892,
+      "eval_samples_per_second": 6.909,
+      "eval_steps_per_second": 0.864,
+      "step": 2530
+    },
+    {
+      "epoch": 23.0,
+      "learning_rate": 5.4156521739130445e-06,
+      "loss": 2.4504,
+      "step": 2645
+    },
+    {
+      "epoch": 23.0,
+      "eval_loss": 2.515150547027588,
+      "eval_runtime": 5.8674,
+      "eval_samples_per_second": 6.817,
+      "eval_steps_per_second": 0.852,
+      "step": 2645
+    },
+    {
+      "epoch": 24.0,
+      "learning_rate": 5.215652173913044e-06,
+      "loss": 2.4447,
+      "step": 2760
+    },
+    {
+      "epoch": 24.0,
+      "eval_loss": 2.4431958198547363,
+      "eval_runtime": 5.9181,
+      "eval_samples_per_second": 6.759,
+      "eval_steps_per_second": 0.845,
+      "step": 2760
+    },
+    {
+      "epoch": 25.0,
+      "learning_rate": 5.015652173913044e-06,
+      "loss": 2.4303,
+      "step": 2875
+    },
+    {
+      "epoch": 25.0,
+      "eval_loss": 2.4032533168792725,
+      "eval_runtime": 5.9198,
+      "eval_samples_per_second": 6.757,
+      "eval_steps_per_second": 0.845,
+      "step": 2875
+    },
+    {
+      "epoch": 26.0,
+      "learning_rate": 4.815652173913044e-06,
+      "loss": 2.4137,
+      "step": 2990
+    },
+    {
+      "epoch": 26.0,
+      "eval_loss": 2.3795552253723145,
+      "eval_runtime": 5.8418,
+      "eval_samples_per_second": 6.847,
+      "eval_steps_per_second": 0.856,
+      "step": 2990
+    },
+    {
+      "epoch": 27.0,
+      "learning_rate": 4.615652173913044e-06,
+      "loss": 2.41,
+      "step": 3105
+    },
+    {
+      "epoch": 27.0,
+      "eval_loss": 2.3598742485046387,
+      "eval_runtime": 5.8868,
+      "eval_samples_per_second": 6.795,
+      "eval_steps_per_second": 0.849,
+      "step": 3105
+    },
+    {
+      "epoch": 28.0,
+      "learning_rate": 4.415652173913044e-06,
+      "loss": 2.3816,
+      "step": 3220
+    },
+    {
+      "epoch": 28.0,
+      "eval_loss": 2.401759386062622,
+      "eval_runtime": 5.8373,
+      "eval_samples_per_second": 6.852,
+      "eval_steps_per_second": 0.857,
+      "step": 3220
+    },
+    {
+      "epoch": 29.0,
+      "learning_rate": 4.215652173913044e-06,
+      "loss": 2.3752,
+      "step": 3335
+    },
+    {
+      "epoch": 29.0,
+      "eval_loss": 2.3115689754486084,
+      "eval_runtime": 5.8962,
+      "eval_samples_per_second": 6.784,
+      "eval_steps_per_second": 0.848,
+      "step": 3335
+    },
+    {
+      "epoch": 30.0,
+      "learning_rate": 4.0156521739130435e-06,
+      "loss": 2.3929,
+      "step": 3450
+    },
+    {
+      "epoch": 30.0,
+      "eval_loss": 2.310469150543213,
+      "eval_runtime": 5.8122,
+      "eval_samples_per_second": 6.882,
+      "eval_steps_per_second": 0.86,
+      "step": 3450
+    },
+    {
+      "epoch": 31.0,
+      "learning_rate": 3.815652173913044e-06,
+      "loss": 2.3791,
+      "step": 3565
+    },
+    {
+      "epoch": 31.0,
+      "eval_loss": 2.367689371109009,
+      "eval_runtime": 5.837,
+      "eval_samples_per_second": 6.853,
+      "eval_steps_per_second": 0.857,
+      "step": 3565
+    },
+    {
+      "epoch": 32.0,
+      "learning_rate": 3.615652173913044e-06,
+      "loss": 2.3639,
+      "step": 3680
+    },
+    {
+      "epoch": 32.0,
+      "eval_loss": 2.431199550628662,
+      "eval_runtime": 5.8179,
+      "eval_samples_per_second": 6.875,
+      "eval_steps_per_second": 0.859,
+      "step": 3680
+    },
+    {
+      "epoch": 33.0,
+      "learning_rate": 3.4156521739130437e-06,
+      "loss": 2.3475,
+      "step": 3795
+    },
+    {
+      "epoch": 33.0,
+      "eval_loss": 2.3051953315734863,
+      "eval_runtime": 5.7888,
+      "eval_samples_per_second": 6.91,
+      "eval_steps_per_second": 0.864,
+      "step": 3795
+    },
+    {
+      "epoch": 34.0,
+      "learning_rate": 3.2156521739130435e-06,
+      "loss": 2.3429,
+      "step": 3910
+    },
+    {
+      "epoch": 34.0,
+      "eval_loss": 2.322197675704956,
+      "eval_runtime": 5.7936,
+      "eval_samples_per_second": 6.904,
+      "eval_steps_per_second": 0.863,
+      "step": 3910
+    },
+    {
+      "epoch": 35.0,
+      "learning_rate": 3.015652173913044e-06,
+      "loss": 2.3115,
+      "step": 4025
+    },
+    {
+      "epoch": 35.0,
+      "eval_loss": 2.3126182556152344,
+      "eval_runtime": 5.8416,
+      "eval_samples_per_second": 6.847,
+      "eval_steps_per_second": 0.856,
+      "step": 4025
+    },
+    {
+      "epoch": 36.0,
+      "learning_rate": 2.815652173913044e-06,
+      "loss": 2.3276,
+      "step": 4140
+    },
+    {
+      "epoch": 36.0,
+      "eval_loss": 2.3154168128967285,
+      "eval_runtime": 5.7988,
+      "eval_samples_per_second": 6.898,
+      "eval_steps_per_second": 0.862,
+      "step": 4140
+    },
+    {
+      "epoch": 37.0,
+      "learning_rate": 2.6156521739130438e-06,
+      "loss": 2.3126,
+      "step": 4255
+    },
+    {
+      "epoch": 37.0,
+      "eval_loss": 2.353442430496216,
+      "eval_runtime": 5.7487,
+      "eval_samples_per_second": 6.958,
+      "eval_steps_per_second": 0.87,
+      "step": 4255
+    },
+    {
+      "epoch": 38.0,
+      "learning_rate": 2.417391304347826e-06,
+      "loss": 2.2934,
+      "step": 4370
+    },
+    {
+      "epoch": 38.0,
+      "eval_loss": 2.2566468715667725,
+      "eval_runtime": 5.902,
+      "eval_samples_per_second": 6.777,
+      "eval_steps_per_second": 0.847,
+      "step": 4370
+    },
+    {
+      "epoch": 39.0,
+      "learning_rate": 2.2173913043478264e-06,
+      "loss": 2.2901,
+      "step": 4485
+    },
+    {
+      "epoch": 39.0,
+      "eval_loss": 2.274752140045166,
+      "eval_runtime": 5.8191,
+      "eval_samples_per_second": 6.874,
+      "eval_steps_per_second": 0.859,
+      "step": 4485
+    },
+    {
+      "epoch": 40.0,
+      "learning_rate": 2.017391304347826e-06,
+      "loss": 2.2622,
+      "step": 4600
+    },
+    {
+      "epoch": 40.0,
+      "eval_loss": 2.2620463371276855,
+      "eval_runtime": 5.7456,
+      "eval_samples_per_second": 6.962,
+      "eval_steps_per_second": 0.87,
+      "step": 4600
+    },
+    {
+      "epoch": 41.0,
+      "learning_rate": 1.8173913043478262e-06,
+      "loss": 2.2707,
+      "step": 4715
+    },
+    {
+      "epoch": 41.0,
+      "eval_loss": 2.2336184978485107,
+      "eval_runtime": 5.8344,
+      "eval_samples_per_second": 6.856,
+      "eval_steps_per_second": 0.857,
+      "step": 4715
+    },
+    {
+      "epoch": 42.0,
+      "learning_rate": 1.6173913043478262e-06,
+      "loss": 2.2338,
+      "step": 4830
+    },
+    {
+      "epoch": 42.0,
+      "eval_loss": 2.224193811416626,
+      "eval_runtime": 5.7896,
+      "eval_samples_per_second": 6.909,
+      "eval_steps_per_second": 0.864,
+      "step": 4830
+    },
+    {
+      "epoch": 43.0,
+      "learning_rate": 1.4173913043478262e-06,
+      "loss": 2.2457,
+      "step": 4945
+    },
+    {
+      "epoch": 43.0,
+      "eval_loss": 2.219238758087158,
+      "eval_runtime": 5.8096,
+      "eval_samples_per_second": 6.885,
+      "eval_steps_per_second": 0.861,
+      "step": 4945
+    },
+    {
+      "epoch": 44.0,
+      "learning_rate": 1.2173913043478262e-06,
+      "loss": 2.227,
+      "step": 5060
+    },
+    {
+      "epoch": 44.0,
+      "eval_loss": 2.206695079803467,
+      "eval_runtime": 5.7447,
+      "eval_samples_per_second": 6.963,
+      "eval_steps_per_second": 0.87,
+      "step": 5060
+    },
+    {
+      "epoch": 45.0,
+      "learning_rate": 1.0173913043478262e-06,
+      "loss": 2.2215,
+      "step": 5175
+    },
+    {
+      "epoch": 45.0,
+      "eval_loss": 2.2183449268341064,
+      "eval_runtime": 5.7702,
+      "eval_samples_per_second": 6.932,
+      "eval_steps_per_second": 0.867,
+      "step": 5175
+    },
+    {
+      "epoch": 46.0,
+      "learning_rate": 8.173913043478261e-07,
+      "loss": 2.2075,
+      "step": 5290
+    },
+    {
+      "epoch": 46.0,
+      "eval_loss": 2.2187769412994385,
+      "eval_runtime": 5.7737,
+      "eval_samples_per_second": 6.928,
+      "eval_steps_per_second": 0.866,
+      "step": 5290
+    },
+    {
+      "epoch": 47.0,
+      "learning_rate": 6.173913043478262e-07,
+      "loss": 2.2286,
+      "step": 5405
+    },
+    {
+      "epoch": 47.0,
+      "eval_loss": 2.2306272983551025,
+      "eval_runtime": 5.7527,
+      "eval_samples_per_second": 6.953,
+      "eval_steps_per_second": 0.869,
+      "step": 5405
+    },
+    {
+      "epoch": 48.0,
+      "learning_rate": 4.1739130434782616e-07,
+      "loss": 2.2292,
+      "step": 5520
+    },
+    {
+      "epoch": 48.0,
+      "eval_loss": 2.2159781455993652,
+      "eval_runtime": 5.8705,
+      "eval_samples_per_second": 6.814,
+      "eval_steps_per_second": 0.852,
+      "step": 5520
+    },
+    {
+      "epoch": 49.0,
+      "learning_rate": 2.173913043478261e-07,
+      "loss": 2.219,
+      "step": 5635
+    },
+    {
+      "epoch": 49.0,
+      "eval_loss": 2.2207822799682617,
+      "eval_runtime": 5.7679,
+      "eval_samples_per_second": 6.935,
+      "eval_steps_per_second": 0.867,
+      "step": 5635
+    },
+    {
+      "epoch": 50.0,
+      "learning_rate": 1.739130434782609e-08,
+      "loss": 2.2125,
+      "step": 5750
+    },
+    {
+      "epoch": 50.0,
+      "eval_loss": 2.216578722000122,
+      "eval_runtime": 5.8453,
+      "eval_samples_per_second": 6.843,
+      "eval_steps_per_second": 0.855,
+      "step": 5750
+    },
+    {
+      "epoch": 50.0,
+      "step": 5750,
+      "total_flos": 1.098949102848e+19,
+      "train_loss": 2.5100708697775134,
+      "train_runtime": 4619.9285,
+      "train_samples_per_second": 4.978,
+      "train_steps_per_second": 1.245
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 5750,
+  "num_train_epochs": 50,
+  "save_steps": 500,
+  "total_flos": 1.098949102848e+19,
+  "trial_name": null,
+  "trial_params": null
+}