Training in progress, epoch 149, checkpoint

Browse files

Files changed (5) hide show

last-checkpoint/model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +260 -3

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:65e330108a44107cfd3a060af52a09c3766517975f292eb60bcf37d37d8254d3
 size 166496880

 version https://git-lfs.github.com/spec/v1
+oid sha256:02258098985a292d68d20bf94bf89b17ca13110b1ae56ee863f5f0d079f4238d
 size 166496880

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:92085ff0fb81e4a4f2212367a112f07fb546d111416dabb30e3ddb0c918d51b1
 size 330495866

 version https://git-lfs.github.com/spec/v1
+oid sha256:761e90a5b9c3c01cf812cc7dbf7f8345138f49ad9e203ed4d4779cfad169a777
 size 330495866

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:795c218f3ddbb3e76a77ad88cdf831b8efe198149593238e9275c9118253ec02
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:74ff39ce5bc1f6039b31922a6e443ab8d8a8f93d5528fc0d576340ae329fb493
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:30c145ebabe049cbd8d4c8ceced4c707816290a109bf20ccefa837d8cb555a00
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:eb678f76da1c9347406d38fe82346b2ac3acd84e6118cb46f17ee79a3da28612
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": 0.24468238651752472,
   "best_model_checkpoint": "chickens-composite-403232323232-150-epochs-wo-transform-metrics-test/checkpoint-95000",
-  "epoch": 148.0,
   "eval_steps": 500,
-  "global_step": 148000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -38386,6 +38386,263 @@
       "eval_samples_per_second": 15.264,
       "eval_steps_per_second": 1.908,
       "step": 148000
     }
   ],
   "logging_steps": 30,
@@ -38405,7 +38662,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 5.09154207105024e+19,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": 0.24468238651752472,
   "best_model_checkpoint": "chickens-composite-403232323232-150-epochs-wo-transform-metrics-test/checkpoint-95000",
+  "epoch": 149.0,
   "eval_steps": 500,
+  "global_step": 149000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 15.264,
       "eval_steps_per_second": 1.908,
       "step": 148000
+    },
+    {
+      "epoch": 148.02,
+      "grad_norm": 42.084232330322266,
+      "learning_rate": 4.298583608501328e-09,
+      "loss": 0.1631,
+      "step": 148020
+    },
+    {
+      "epoch": 148.05,
+      "grad_norm": 42.267086029052734,
+      "learning_rate": 4.169328287299545e-09,
+      "loss": 0.1619,
+      "step": 148050
+    },
+    {
+      "epoch": 148.08,
+      "grad_norm": 39.14877700805664,
+      "learning_rate": 4.042045240927883e-09,
+      "loss": 0.1887,
+      "step": 148080
+    },
+    {
+      "epoch": 148.11,
+      "grad_norm": 75.59671020507812,
+      "learning_rate": 3.9167345196361454e-09,
+      "loss": 0.1908,
+      "step": 148110
+    },
+    {
+      "epoch": 148.14,
+      "grad_norm": 87.17718505859375,
+      "learning_rate": 3.793396172895314e-09,
+      "loss": 0.1728,
+      "step": 148140
+    },
+    {
+      "epoch": 148.17,
+      "grad_norm": 37.11481475830078,
+      "learning_rate": 3.672030249396441e-09,
+      "loss": 0.1674,
+      "step": 148170
+    },
+    {
+      "epoch": 148.2,
+      "grad_norm": 34.75517272949219,
+      "learning_rate": 3.5526367970539765e-09,
+      "loss": 0.1768,
+      "step": 148200
+    },
+    {
+      "epoch": 148.23,
+      "grad_norm": 205.51870727539062,
+      "learning_rate": 3.4352158630018837e-09,
+      "loss": 0.1609,
+      "step": 148230
+    },
+    {
+      "epoch": 148.26,
+      "grad_norm": 35.48714065551758,
+      "learning_rate": 3.31976749359586e-09,
+      "loss": 0.1847,
+      "step": 148260
+    },
+    {
+      "epoch": 148.29,
+      "grad_norm": 143.81561279296875,
+      "learning_rate": 3.206291734413891e-09,
+      "loss": 0.1883,
+      "step": 148290
+    },
+    {
+      "epoch": 148.32,
+      "grad_norm": 98.67874908447266,
+      "learning_rate": 3.094788630254031e-09,
+      "loss": 0.1725,
+      "step": 148320
+    },
+    {
+      "epoch": 148.35,
+      "grad_norm": 51.73759078979492,
+      "learning_rate": 2.9852582251355124e-09,
+      "loss": 0.1788,
+      "step": 148350
+    },
+    {
+      "epoch": 148.38,
+      "grad_norm": 37.59303665161133,
+      "learning_rate": 2.8777005622998567e-09,
+      "loss": 0.1682,
+      "step": 148380
+    },
+    {
+      "epoch": 148.41,
+      "grad_norm": 80.69348907470703,
+      "learning_rate": 2.772115684209209e-09,
+      "loss": 0.1846,
+      "step": 148410
+    },
+    {
+      "epoch": 148.44,
+      "grad_norm": 35.9366455078125,
+      "learning_rate": 2.6685036325457826e-09,
+      "loss": 0.1715,
+      "step": 148440
+    },
+    {
+      "epoch": 148.47,
+      "grad_norm": 1834.0330810546875,
+      "learning_rate": 2.5668644482151892e-09,
+      "loss": 0.1731,
+      "step": 148470
+    },
+    {
+      "epoch": 148.5,
+      "grad_norm": 30.97291374206543,
+      "learning_rate": 2.4671981713420003e-09,
+      "loss": 0.1783,
+      "step": 148500
+    },
+    {
+      "epoch": 148.53,
+      "grad_norm": 33.913604736328125,
+      "learning_rate": 2.369504841273629e-09,
+      "loss": 0.1843,
+      "step": 148530
+    },
+    {
+      "epoch": 148.56,
+      "grad_norm": 22.96918487548828,
+      "learning_rate": 2.2737844965775578e-09,
+      "loss": 0.1918,
+      "step": 148560
+    },
+    {
+      "epoch": 148.59,
+      "grad_norm": 35.848934173583984,
+      "learning_rate": 2.1800371750430037e-09,
+      "loss": 0.1711,
+      "step": 148590
+    },
+    {
+      "epoch": 148.62,
+      "grad_norm": 130.026123046875,
+      "learning_rate": 2.088262913679251e-09,
+      "loss": 0.1766,
+      "step": 148620
+    },
+    {
+      "epoch": 148.65,
+      "grad_norm": 84.3224105834961,
+      "learning_rate": 1.9984617487173174e-09,
+      "loss": 0.1673,
+      "step": 148650
+    },
+    {
+      "epoch": 148.68,
+      "grad_norm": 116.34769439697266,
+      "learning_rate": 1.9106337156099553e-09,
+      "loss": 0.1798,
+      "step": 148680
+    },
+    {
+      "epoch": 148.71,
+      "grad_norm": 88.51609802246094,
+      "learning_rate": 1.8247788490299846e-09,
+      "loss": 0.1918,
+      "step": 148710
+    },
+    {
+      "epoch": 148.74,
+      "grad_norm": 43.09914779663086,
+      "learning_rate": 1.740897182871404e-09,
+      "loss": 0.187,
+      "step": 148740
+    },
+    {
+      "epoch": 148.77,
+      "grad_norm": 45.688201904296875,
+      "learning_rate": 1.6589887502493907e-09,
+      "loss": 0.1915,
+      "step": 148770
+    },
+    {
+      "epoch": 148.8,
+      "grad_norm": 26.354772567749023,
+      "learning_rate": 1.5790535835003006e-09,
+      "loss": 0.1609,
+      "step": 148800
+    },
+    {
+      "epoch": 148.83,
+      "grad_norm": 122.46343231201172,
+      "learning_rate": 1.5010917141811132e-09,
+      "loss": 0.1604,
+      "step": 148830
+    },
+    {
+      "epoch": 148.86,
+      "grad_norm": 406.5648193359375,
+      "learning_rate": 1.425103173069986e-09,
+      "loss": 0.2423,
+      "step": 148860
+    },
+    {
+      "epoch": 148.89,
+      "grad_norm": 59.21432876586914,
+      "learning_rate": 1.3510879901657003e-09,
+      "loss": 0.1776,
+      "step": 148890
+    },
+    {
+      "epoch": 148.92,
+      "grad_norm": 53.223148345947266,
+      "learning_rate": 1.2790461946887712e-09,
+      "loss": 0.1913,
+      "step": 148920
+    },
+    {
+      "epoch": 148.95,
+      "grad_norm": 63.24610137939453,
+      "learning_rate": 1.2089778150797816e-09,
+      "loss": 0.1795,
+      "step": 148950
+    },
+    {
+      "epoch": 148.98,
+      "grad_norm": 66.03044128417969,
+      "learning_rate": 1.1408828790010484e-09,
+      "loss": 0.1662,
+      "step": 148980
+    },
+    {
+      "epoch": 149.0,
+      "eval_loss": 0.25540730357170105,
+      "eval_map": 0.8454,
+      "eval_map_50": 0.9638,
+      "eval_map_75": 0.9414,
+      "eval_map_chicken": 0.8417,
+      "eval_map_duck": 0.7981,
+      "eval_map_large": 0.8191,
+      "eval_map_medium": 0.8525,
+      "eval_map_plant": 0.8964,
+      "eval_map_small": 0.3586,
+      "eval_mar_1": 0.3399,
+      "eval_mar_10": 0.8795,
+      "eval_mar_100": 0.8819,
+      "eval_mar_100_chicken": 0.8813,
+      "eval_mar_100_duck": 0.8407,
+      "eval_mar_100_plant": 0.9237,
+      "eval_mar_large": 0.8593,
+      "eval_mar_medium": 0.8889,
+      "eval_mar_small": 0.5029,
+      "eval_runtime": 13.5683,
+      "eval_samples_per_second": 14.74,
+      "eval_steps_per_second": 1.843,
+      "step": 149000
     }
   ],
   "logging_steps": 30,
       "attributes": {}
     }
   },
+  "total_flos": 5.12594438234112e+19,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null