Model save

Files changed (4) hide show

README.md CHANGED Viewed

@@ -40,7 +40,7 @@ The following hyperparameters were used during training:
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_steps: 5
-- training_steps: 20
 ### Training results

 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_steps: 5
+- training_steps: 30
 ### Training results

adapter_config.json CHANGED Viewed

@@ -20,30 +20,30 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "transformer.h.5.mlp.c_fc",
-    "transformer.h.5.mlp.c_proj",
-    "transformer.h.2.mlp.c_proj",
-    "transformer.h.0.mlp.c_fc",
-    "transformer.h.0.attn.c_attn",
     "transformer.h.2.attn.c_proj",
     "transformer.h.1.mlp.c_proj",
-    "transformer.h.4.mlp.c_proj",
-    "transformer.h.3.mlp.c_fc",
-    "transformer.h.4.attn.c_attn",
     "transformer.h.3.attn.c_proj",
     "transformer.h.5.attn.c_proj",
-    "transformer.h.1.mlp.c_fc",
     "transformer.h.1.attn.c_proj",
     "transformer.h.5.attn.c_attn",
-    "transformer.h.0.mlp.c_proj",
-    "transformer.h.2.attn.c_attn",
-    "transformer.h.3.attn.c_attn",
-    "transformer.h.0.attn.c_proj",
-    "transformer.h.4.mlp.c_fc",
-    "transformer.h.2.mlp.c_fc",
     "transformer.h.3.mlp.c_proj",
-    "transformer.h.4.attn.c_proj",
-    "transformer.h.1.attn.c_attn"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "transformer.h.2.attn.c_proj",
+    "transformer.h.0.attn.c_proj",
+    "transformer.h.0.mlp.c_proj",
+    "transformer.h.1.attn.c_attn",
+    "transformer.h.4.mlp.c_fc",
+    "transformer.h.5.mlp.c_fc",
+    "transformer.h.3.attn.c_attn",
+    "transformer.h.2.attn.c_attn",
     "transformer.h.1.mlp.c_proj",
+    "transformer.h.2.mlp.c_fc",
     "transformer.h.3.attn.c_proj",
+    "transformer.h.4.attn.c_proj",
     "transformer.h.5.attn.c_proj",
+    "transformer.h.0.mlp.c_fc",
     "transformer.h.1.attn.c_proj",
+    "transformer.h.1.mlp.c_fc",
+    "transformer.h.0.attn.c_attn",
     "transformer.h.5.attn.c_attn",
+    "transformer.h.3.mlp.c_fc",
     "transformer.h.3.mlp.c_proj",
+    "transformer.h.4.attn.c_attn",
+    "transformer.h.2.mlp.c_proj",
+    "transformer.h.5.mlp.c_proj",
+    "transformer.h.4.mlp.c_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:91f272cf9fe0943c09bd94b05b3e9516bf591e69ed5fc56b1a00283d5d0df7e2
 size 2365304

 version https://git-lfs.github.com/spec/v1
+oid sha256:313174a13db3decbfdb8cc89ca7bf90b3b0a449053671b790cd0670f6c2fa00b
 size 2365304

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:79c175fb73fe6ced26b82f8aaad0a5998320d8fbe263df423b87478db363781d
 size 5112

 version https://git-lfs.github.com/spec/v1
+oid sha256:58c2d8043c93feda75c4844001deaf3b934b34158ab14a6bcf4e66560335330a
 size 5112