gguichard
/

wsd_myriade_synth_data_gpt4turbov4

Model card Files Files and versions Community

gguichard commited on Mar 27

Commit

19ee6f3

•

1 Parent(s): 9260eac

Training in progress, epoch 5, checkpoint

Browse files

Files changed (5) hide show

checkpoint-1060/adapter_config.json +1 -1
checkpoint-1060/adapter_model.bin +2 -2
checkpoint-1060/optimizer.pt +2 -2
checkpoint-1060/trainer_state.json +26 -26
checkpoint-1060/training_args.bin +1 -1

checkpoint-1060/adapter_config.json CHANGED Viewed

@@ -14,7 +14,7 @@
     "classifier.weight"
   ],
   "peft_type": "LORA",
-  "r": 128,
   "revision": null,
   "target_modules": [
     "query",

     "classifier.weight"
   ],
   "peft_type": "LORA",
+  "r": 64,
   "revision": null,
   "target_modules": [
     "query",

checkpoint-1060/adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ddcd04b0679144aa4828d0df260eaadf4073fb0b3491e7cd576562ec87c3179b
-size 230550429

 version https://git-lfs.github.com/spec/v1
+oid sha256:6cb3429c2a084a696b78f22cb270c62bf7d4694f9faab5648efae9afccb050b8
+size 117304221

checkpoint-1060/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d3954334f99081185ac3f0146aaa3bf5b2c2874a90cffefc4d0e4047e2aa5f1c
-size 461144966

 version https://git-lfs.github.com/spec/v1
+oid sha256:8c83cacb0934c73627d7c7b542bc3ae197572e76ce209141dfe2a2933380e54d
+size 234652550

checkpoint-1060/trainer_state.json CHANGED Viewed

@@ -11,71 +11,71 @@
     {
       "epoch": 1.0,
       "learning_rate": 9.95e-05,
-      "loss": 6.3737,
       "step": 212
     },
     {
       "epoch": 1.0,
-      "eval_loss": 5.842774868011475,
-      "eval_runtime": 3.9529,
-      "eval_samples_per_second": 171.015,
-      "eval_steps_per_second": 21.503,
       "step": 212
     },
     {
       "epoch": 2.0,
       "learning_rate": 9.900000000000001e-05,
-      "loss": 5.5296,
       "step": 424
     },
     {
       "epoch": 2.0,
-      "eval_loss": 4.859792232513428,
-      "eval_runtime": 4.2848,
-      "eval_samples_per_second": 157.766,
-      "eval_steps_per_second": 19.837,
       "step": 424
     },
     {
       "epoch": 3.0,
       "learning_rate": 9.850000000000001e-05,
-      "loss": 4.6838,
       "step": 636
     },
     {
       "epoch": 3.0,
-      "eval_loss": 4.013933181762695,
-      "eval_runtime": 4.1662,
-      "eval_samples_per_second": 162.258,
-      "eval_steps_per_second": 20.402,
       "step": 636
     },
     {
       "epoch": 4.0,
       "learning_rate": 9.8e-05,
-      "loss": 3.9438,
       "step": 848
     },
     {
       "epoch": 4.0,
-      "eval_loss": 3.277362585067749,
-      "eval_runtime": 4.2258,
-      "eval_samples_per_second": 159.97,
-      "eval_steps_per_second": 20.115,
       "step": 848
     },
     {
       "epoch": 5.0,
       "learning_rate": 9.75e-05,
-      "loss": 3.2751,
       "step": 1060
     },
     {
       "epoch": 5.0,
-      "eval_loss": 2.62673282623291,
-      "eval_runtime": 4.5502,
-      "eval_samples_per_second": 148.565,
-      "eval_steps_per_second": 18.68,
       "step": 1060
     }
   ],
@@ -83,7 +83,7 @@
   "max_steps": 42400,
   "num_train_epochs": 200,
   "save_steps": 500,
-  "total_flos": 1546564063916460.0,
   "trial_name": null,
   "trial_params": null
 }

     {
       "epoch": 1.0,
       "learning_rate": 9.95e-05,
+      "loss": 6.3714,
       "step": 212
     },
     {
       "epoch": 1.0,
+      "eval_loss": 5.850927352905273,
+      "eval_runtime": 3.8282,
+      "eval_samples_per_second": 176.584,
+      "eval_steps_per_second": 22.204,
       "step": 212
     },
     {
       "epoch": 2.0,
       "learning_rate": 9.900000000000001e-05,
+      "loss": 5.5438,
       "step": 424
     },
     {
       "epoch": 2.0,
+      "eval_loss": 4.862037658691406,
+      "eval_runtime": 3.7425,
+      "eval_samples_per_second": 180.626,
+      "eval_steps_per_second": 22.712,
       "step": 424
     },
     {
       "epoch": 3.0,
       "learning_rate": 9.850000000000001e-05,
+      "loss": 4.6993,
       "step": 636
     },
     {
       "epoch": 3.0,
+      "eval_loss": 4.018372058868408,
+      "eval_runtime": 4.0424,
+      "eval_samples_per_second": 167.229,
+      "eval_steps_per_second": 21.027,
       "step": 636
     },
     {
       "epoch": 4.0,
       "learning_rate": 9.8e-05,
+      "loss": 3.967,
       "step": 848
     },
     {
       "epoch": 4.0,
+      "eval_loss": 3.290557384490967,
+      "eval_runtime": 4.3933,
+      "eval_samples_per_second": 153.872,
+      "eval_steps_per_second": 19.348,
       "step": 848
     },
     {
       "epoch": 5.0,
       "learning_rate": 9.75e-05,
+      "loss": 3.305,
       "step": 1060
     },
     {
       "epoch": 5.0,
+      "eval_loss": 2.6497254371643066,
+      "eval_runtime": 4.3562,
+      "eval_samples_per_second": 155.182,
+      "eval_steps_per_second": 19.513,
       "step": 1060
     }
   ],
   "max_steps": 42400,
   "num_train_epochs": 200,
   "save_steps": 500,
+  "total_flos": 1425048900923820.0,
   "trial_name": null,
   "trial_params": null
 }

checkpoint-1060/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b45ac36706a0f96e1fbfd751ddcc73ed3d4e95773bdb931420d6f73f3adff937
 size 4155

 version https://git-lfs.github.com/spec/v1
+oid sha256:4e7d47d9ef4da320ee46463f8716d365eb34b4bc5488090164af1bcf3ad60b35
 size 4155