/mistral-MCQ

Files changed (8) hide show

README.md CHANGED Viewed

@@ -44,14 +44,10 @@ The following hyperparameters were used during training:
 - lr_scheduler_warmup_ratio: 0.03
 - num_epochs: 1
-### Training results
 ### Framework versions
 - PEFT 0.10.0
 - Transformers 4.39.3
-- Pytorch 2.2.1+cu121
 - Datasets 2.18.0
 - Tokenizers 0.15.2

 - lr_scheduler_warmup_ratio: 0.03
 - num_epochs: 1
 ### Framework versions
 - PEFT 0.10.0
 - Transformers 4.39.3
+- Pytorch 2.1.2
 - Datasets 2.18.0
 - Tokenizers 0.15.2

adapter_config.json CHANGED Viewed

@@ -20,11 +20,11 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "gate_proj",
-    "v_proj",
     "o_proj",
     "k_proj",
-    "q_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "o_proj",
     "k_proj",
+    "gate_proj",
+    "q_proj",
+    "v_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8ad6dc61cea4ea7ae2238a64b517642fe244e1ca2075248f6fad18a1c397f3de
 size 369142184

 version https://git-lfs.github.com/spec/v1
+oid sha256:5380716c2fe7bfff8528b061ce0167c0958bc28dee633cfa6375117df1a78c48
 size 369142184

runs/Apr09_15-43-08_a102a0159da3/events.out.tfevents.1712677424.a102a0159da3.34.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:72608cceeb845f8293a3a39db499a4a75b9f438d6d3b2185fb52bdd2f26df7c3
+size 5080

tokenizer.json CHANGED Viewed

@@ -62,12 +62,6 @@
           "id": "A",
           "type_id": 0
         }
-      },
-      {
-        "SpecialToken": {
-          "id": "</s>",
-          "type_id": 0
-        }
       }
     ],
     "pair": [
@@ -83,12 +77,6 @@
           "type_id": 0
         }
       },
-      {
-        "SpecialToken": {
-          "id": "</s>",
-          "type_id": 0
-        }
-      },
       {
         "SpecialToken": {
           "id": "<s>",
@@ -100,24 +88,9 @@
           "id": "B",
           "type_id": 1
         }
-      },
-      {
-        "SpecialToken": {
-          "id": "</s>",
-          "type_id": 1
-        }
       }
     ],
     "special_tokens": {
-      "</s>": {
-        "id": "</s>",
-        "ids": [
-          2
-        ],
-        "tokens": [
-          "</s>"
-        ]
-      },
       "<s>": {
         "id": "<s>",
         "ids": [

           "id": "A",
           "type_id": 0
         }
       }
     ],
     "pair": [
           "type_id": 0
         }
       },
       {
         "SpecialToken": {
           "id": "<s>",
           "id": "B",
           "type_id": 1
         }
       }
     ],
     "special_tokens": {
       "<s>": {
         "id": "<s>",
         "ids": [

tokenizer.model ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:dadfd56d766715c61d2ef780a525ab43b8e6da4de6865bda3d95fdef5e134055
+size 493443

tokenizer_config.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "add_bos_token": true,
-  "add_eos_token": true,
   "added_tokens_decoder": {
     "0": {
       "content": "<unk>",

 {
   "add_bos_token": true,
+  "add_eos_token": false,
   "added_tokens_decoder": {
     "0": {
       "content": "<unk>",

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fc6752991eb064f5476769d7bdc3f881a5f6821059c2fbf90ac4c76ad27f8f94
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:654fc96c5593be9115eb856819ecd76b107cb665c1b86b1ffae8fa30d1f266b6
 size 4920