Upload folder using huggingface_hub

Files changed (5) hide show

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1912b4b957d908b8bfc710c3e58558d93617ba78eeee6b44cea5846184e311aa
 size 109069176

 version https://git-lfs.github.com/spec/v1
+oid sha256:e962fe1a008096446bba2f5f0939a027f2337b0c8d54a86662f4b97eb3ce56e7
 size 109069176

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f61189ba8e2df9508d8734043f68c2833bde41baa22941571ec4278f299a891b
 size 218182458

 version https://git-lfs.github.com/spec/v1
+oid sha256:0b9013e63a2c92f1d852bfa0120360bf3b76ec267a1e0375845d5663d98ee45b
 size 218182458

rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1e8d2ce26e6c0f5a47ca9bc5544c0f80a1d4937019d9d7af01320826a96817c0
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:f1218d6cf5250ca208e3f4fa5667046fe64d6adcd8f3e76f241175ded98a71c5
 size 14244

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:51c0ed39e99f88f21247352263bae5548e8fbac6d6858a19cd7d11c82b12390d
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:2a9cac68c495800a4bdcb66ffc3cc1e8f81886b9e59bf61baf66314bb15b9839
 size 1064

trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.9323671497584543,
   "eval_steps": 25,
-  "global_step": 200,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -127,6 +127,36 @@
       "eval_samples_per_second": 3.915,
       "eval_steps_per_second": 0.492,
       "step": 200
     }
   ],
   "logging_steps": 25,
@@ -141,12 +171,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": false
       },
       "attributes": {}
     }
   },
-  "total_flos": 1.5515046692683776e+16,
   "train_batch_size": 1,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 2.4154589371980677,
   "eval_steps": 25,
+  "global_step": 250,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 3.915,
       "eval_steps_per_second": 0.492,
       "step": 200
+    },
+    {
+      "epoch": 2.1739130434782608,
+      "grad_norm": 0.11684705317020416,
+      "learning_rate": 1.305099728150655e-05,
+      "loss": 0.8363,
+      "step": 225
+    },
+    {
+      "epoch": 2.1739130434782608,
+      "eval_loss": 0.8260972499847412,
+      "eval_runtime": 52.8873,
+      "eval_samples_per_second": 3.914,
+      "eval_steps_per_second": 0.492,
+      "step": 225
+    },
+    {
+      "epoch": 2.4154589371980677,
+      "grad_norm": 0.12228501588106155,
+      "learning_rate": 0.0,
+      "loss": 0.8416,
+      "step": 250
+    },
+    {
+      "epoch": 2.4154589371980677,
+      "eval_loss": 0.8257294297218323,
+      "eval_runtime": 52.5215,
+      "eval_samples_per_second": 3.941,
+      "eval_steps_per_second": 0.495,
+      "step": 250
     }
   ],
   "logging_steps": 25,
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": true
       },
       "attributes": {}
     }
   },
+  "total_flos": 1.9398176774774784e+16,
   "train_batch_size": 1,
   "trial_name": null,
   "trial_params": null