Training in progress, step 60, checkpoint

Browse files

Files changed (5) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +63 -3

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:082e0f65d9408d58de78384d26e1aad492bc230933c9354dc36177931ee5be37
 size 83945296

 version https://git-lfs.github.com/spec/v1
+oid sha256:e219836db331fb2c22e167af2c158d700560aae27dc6a75c160dae363c629cd1
 size 83945296

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1303a139905c4f79955959992b09a87c0185864715be3314300530474ce995a8
 size 42545748

 version https://git-lfs.github.com/spec/v1
+oid sha256:d088274e6e4b583afe59f323ed350eaf66dca870661c394c8ede6293508ee82e
 size 42545748

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fb666093d54c6ea7061dd8f6ce0161fe9011e0b6517a61dc248791ee21e8e12d
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:babf9cef0f970e1cd241f9533a5b0bc052a39fc9df617e7f31209a9691bd42d1
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ff3806b6ededc075c4c89012dc49cff3604a5f3bc56562d72a0f71b6ec838696
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:87f5541cd8b8cc2355cb28b7b43b87c2e735f1841d8477f8ed4c15392845734c
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.02,
   "eval_steps": 1000,
-  "global_step": 50,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -307,13 +307,73 @@
       "learning_rate": 0.00010526315789473685,
       "loss": 1.4282,
       "step": 50
     }
   ],
   "logging_steps": 1,
   "max_steps": 100,
   "num_train_epochs": 1,
   "save_steps": 10,
-  "total_flos": 3055618882191360.0,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.024,
   "eval_steps": 1000,
+  "global_step": 60,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 0.00010526315789473685,
       "loss": 1.4282,
       "step": 50
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.00010315789473684211,
+      "loss": 1.7713,
+      "step": 51
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.00010105263157894738,
+      "loss": 1.6238,
+      "step": 52
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 9.894736842105263e-05,
+      "loss": 1.5243,
+      "step": 53
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 9.68421052631579e-05,
+      "loss": 1.4315,
+      "step": 54
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 9.473684210526316e-05,
+      "loss": 1.48,
+      "step": 55
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 9.263157894736843e-05,
+      "loss": 1.7109,
+      "step": 56
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 9.052631578947369e-05,
+      "loss": 1.6509,
+      "step": 57
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 8.842105263157894e-05,
+      "loss": 1.5552,
+      "step": 58
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 8.631578947368421e-05,
+      "loss": 1.8228,
+      "step": 59
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 8.421052631578948e-05,
+      "loss": 1.5684,
+      "step": 60
     }
   ],
   "logging_steps": 1,
   "max_steps": 100,
   "num_train_epochs": 1,
   "save_steps": 10,
+  "total_flos": 3532725037301760.0,
   "trial_name": null,
   "trial_params": null
 }