gguichard
/

wsd_myriade_synth_data_gpt4turbov4

Model card Files Files and versions Community

gguichard commited on Mar 27

Commit

dd80c86

•

1 Parent(s): ef0ad1d

Training in progress, epoch 7, checkpoint

Browse files

Files changed (5) hide show

checkpoint-1484/adapter_config.json +1 -1
checkpoint-1484/adapter_model.bin +2 -2
checkpoint-1484/optimizer.pt +2 -2
checkpoint-1484/trainer_state.json +36 -36
checkpoint-1484/training_args.bin +1 -1

checkpoint-1484/adapter_config.json CHANGED Viewed

@@ -14,7 +14,7 @@
     "classifier.weight"
   ],
   "peft_type": "LORA",
-  "r": 128,
   "revision": null,
   "target_modules": [
     "query",

     "classifier.weight"
   ],
   "peft_type": "LORA",
+  "r": 64,
   "revision": null,
   "target_modules": [
     "query",

checkpoint-1484/adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c0403f99471e01bbe94d0e08f743a3c09728ee1b175692e6c07115cbbcc0a415
-size 230550429

 version https://git-lfs.github.com/spec/v1
+oid sha256:72dc78522c1f22d8b13839ed6d26c6aded0a2cc8e33a19c37bbf8f3bf6faf103
+size 117304221

checkpoint-1484/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9fe51714705fc1530ae4e99c7f18ad6b336f8285d351ff8a400717793e05a4ca
-size 461144966

 version https://git-lfs.github.com/spec/v1
+oid sha256:d86a8c8d83591a983a0ac4fe26d8c5ba7653ea63c618a7f5c3d0ab3a5ca3f961
+size 234652550

checkpoint-1484/trainer_state.json CHANGED Viewed

@@ -11,99 +11,99 @@
     {
       "epoch": 1.0,
       "learning_rate": 9.95e-05,
-      "loss": 6.3737,
       "step": 212
     },
     {
       "epoch": 1.0,
-      "eval_loss": 5.842774868011475,
-      "eval_runtime": 3.9529,
-      "eval_samples_per_second": 171.015,
-      "eval_steps_per_second": 21.503,
       "step": 212
     },
     {
       "epoch": 2.0,
       "learning_rate": 9.900000000000001e-05,
-      "loss": 5.5296,
       "step": 424
     },
     {
       "epoch": 2.0,
-      "eval_loss": 4.859792232513428,
-      "eval_runtime": 4.2848,
-      "eval_samples_per_second": 157.766,
-      "eval_steps_per_second": 19.837,
       "step": 424
     },
     {
       "epoch": 3.0,
       "learning_rate": 9.850000000000001e-05,
-      "loss": 4.6838,
       "step": 636
     },
     {
       "epoch": 3.0,
-      "eval_loss": 4.013933181762695,
-      "eval_runtime": 4.1662,
-      "eval_samples_per_second": 162.258,
-      "eval_steps_per_second": 20.402,
       "step": 636
     },
     {
       "epoch": 4.0,
       "learning_rate": 9.8e-05,
-      "loss": 3.9438,
       "step": 848
     },
     {
       "epoch": 4.0,
-      "eval_loss": 3.277362585067749,
-      "eval_runtime": 4.2258,
-      "eval_samples_per_second": 159.97,
-      "eval_steps_per_second": 20.115,
       "step": 848
     },
     {
       "epoch": 5.0,
       "learning_rate": 9.75e-05,
-      "loss": 3.2751,
       "step": 1060
     },
     {
       "epoch": 5.0,
-      "eval_loss": 2.62673282623291,
-      "eval_runtime": 4.5502,
-      "eval_samples_per_second": 148.565,
-      "eval_steps_per_second": 18.68,
       "step": 1060
     },
     {
       "epoch": 6.0,
       "learning_rate": 9.7e-05,
-      "loss": 2.6863,
       "step": 1272
     },
     {
       "epoch": 6.0,
-      "eval_loss": 2.0860772132873535,
-      "eval_runtime": 4.2538,
-      "eval_samples_per_second": 158.917,
-      "eval_steps_per_second": 19.982,
       "step": 1272
     },
     {
       "epoch": 7.0,
       "learning_rate": 9.65e-05,
-      "loss": 2.193,
       "step": 1484
     },
     {
       "epoch": 7.0,
-      "eval_loss": 1.6755822896957397,
-      "eval_runtime": 4.2558,
-      "eval_samples_per_second": 158.842,
-      "eval_steps_per_second": 19.973,
       "step": 1484
     }
   ],
@@ -111,7 +111,7 @@
   "max_steps": 42400,
   "num_train_epochs": 200,
   "save_steps": 500,
-  "total_flos": 2164845934111632.0,
   "trial_name": null,
   "trial_params": null
 }

     {
       "epoch": 1.0,
       "learning_rate": 9.95e-05,
+      "loss": 6.3714,
       "step": 212
     },
     {
       "epoch": 1.0,
+      "eval_loss": 5.850927352905273,
+      "eval_runtime": 3.8282,
+      "eval_samples_per_second": 176.584,
+      "eval_steps_per_second": 22.204,
       "step": 212
     },
     {
       "epoch": 2.0,
       "learning_rate": 9.900000000000001e-05,
+      "loss": 5.5438,
       "step": 424
     },
     {
       "epoch": 2.0,
+      "eval_loss": 4.862037658691406,
+      "eval_runtime": 3.7425,
+      "eval_samples_per_second": 180.626,
+      "eval_steps_per_second": 22.712,
       "step": 424
     },
     {
       "epoch": 3.0,
       "learning_rate": 9.850000000000001e-05,
+      "loss": 4.6993,
       "step": 636
     },
     {
       "epoch": 3.0,
+      "eval_loss": 4.018372058868408,
+      "eval_runtime": 4.0424,
+      "eval_samples_per_second": 167.229,
+      "eval_steps_per_second": 21.027,
       "step": 636
     },
     {
       "epoch": 4.0,
       "learning_rate": 9.8e-05,
+      "loss": 3.967,
       "step": 848
     },
     {
       "epoch": 4.0,
+      "eval_loss": 3.290557384490967,
+      "eval_runtime": 4.3933,
+      "eval_samples_per_second": 153.872,
+      "eval_steps_per_second": 19.348,
       "step": 848
     },
     {
       "epoch": 5.0,
       "learning_rate": 9.75e-05,
+      "loss": 3.305,
       "step": 1060
     },
     {
       "epoch": 5.0,
+      "eval_loss": 2.6497254371643066,
+      "eval_runtime": 4.3562,
+      "eval_samples_per_second": 155.182,
+      "eval_steps_per_second": 19.513,
       "step": 1060
     },
     {
       "epoch": 6.0,
       "learning_rate": 9.7e-05,
+      "loss": 2.7185,
       "step": 1272
     },
     {
       "epoch": 6.0,
+      "eval_loss": 2.1158342361450195,
+      "eval_runtime": 4.5634,
+      "eval_samples_per_second": 148.135,
+      "eval_steps_per_second": 18.626,
       "step": 1272
     },
     {
       "epoch": 7.0,
       "learning_rate": 9.65e-05,
+      "loss": 2.2181,
       "step": 1484
     },
     {
       "epoch": 7.0,
+      "eval_loss": 1.6882902383804321,
+      "eval_runtime": 4.3232,
+      "eval_samples_per_second": 156.367,
+      "eval_steps_per_second": 19.662,
       "step": 1484
     }
   ],
   "max_steps": 42400,
   "num_train_epochs": 200,
   "save_steps": 500,
+  "total_flos": 1994751715142544.0,
   "trial_name": null,
   "trial_params": null
 }

checkpoint-1484/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b45ac36706a0f96e1fbfd751ddcc73ed3d4e95773bdb931420d6f73f3adff937
 size 4155

 version https://git-lfs.github.com/spec/v1
+oid sha256:4e7d47d9ef4da320ee46463f8716d365eb34b4bc5488090164af1bcf3ad60b35
 size 4155