llme2_sft_model_rlaif

Files changed (8) hide show

README.md CHANGED Viewed

@@ -1,8 +1,11 @@
 ---
 license: mit
-base_model: HuggingFaceH4/zephyr-7b-alpha
 tags:
 - generated_from_trainer
 model-index:
 - name: sft_zephyr
   results: []
@@ -46,7 +49,8 @@ The following hyperparameters were used during training:
 ### Framework versions
-- Transformers 4.35.2
-- Pytorch 2.1.0+cu118
-- Datasets 2.15.0
-- Tokenizers 0.15.0

 ---
 license: mit
+library_name: peft
 tags:
+- trl
+- sft
 - generated_from_trainer
+base_model: HuggingFaceH4/zephyr-7b-alpha
 model-index:
 - name: sft_zephyr
   results: []
 ### Framework versions
+- PEFT 0.8.1
+- Transformers 4.37.2
+- Pytorch 2.1.0+cu121
+- Datasets 2.16.1
+- Tokenizers 0.15.1

adapter_config.json CHANGED Viewed

@@ -8,16 +8,20 @@
   "init_lora_weights": true,
   "layers_pattern": null,
   "layers_to_transform": null,
   "lora_alpha": 16,
   "lora_dropout": 0.1,
   "modules_to_save": null,
   "peft_type": "LORA",
   "r": 64,
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "v_proj",
-    "q_proj"
   ],
-  "task_type": "CAUSAL_LM"
 }

   "init_lora_weights": true,
   "layers_pattern": null,
   "layers_to_transform": null,
+  "loftq_config": {},
   "lora_alpha": 16,
   "lora_dropout": 0.1,
+  "megatron_config": null,
+  "megatron_core": "megatron.core",
   "modules_to_save": null,
   "peft_type": "LORA",
   "r": 64,
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
+    "q_proj",
+    "v_proj"
   ],
+  "task_type": "CAUSAL_LM",
+  "use_rslora": false
 }

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d038325d8d2f6680ee8c9302ec74107cca8a185bbecfd421cd6fc7017639eba0
 size 109069176

 version https://git-lfs.github.com/spec/v1
+oid sha256:0c26a2ba5c9b109b953f6155dd9cd69c970a42028dd8c6dae6e8fa227a3fe3bd
 size 109069176

runs/Jan30_22-19-14_fd46eea5b897/events.out.tfevents.1706653155.fd46eea5b897.923.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e2f19e03ac2b64e03473208ec9b29e8a5436e0120a14dadf1f5007fb4ef763b
+size 5091

tokenizer.json CHANGED Viewed

@@ -1,6 +1,11 @@
 {
   "version": "1.0",
-  "truncation": null,
   "padding": null,
   "added_tokens": [
     {

 {
   "version": "1.0",
+  "truncation": {
+    "direction": "Left",
+    "max_length": 2048,
+    "strategy": "LongestFirst",
+    "stride": 0
+  },
   "padding": null,
   "added_tokens": [
     {

tokenizer.model ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:dadfd56d766715c61d2ef780a525ab43b8e6da4de6865bda3d95fdef5e134055
+size 493443

tokenizer_config.json CHANGED Viewed

@@ -1,4 +1,6 @@
 {
   "added_tokens_decoder": {
     "0": {
       "content": "<unk>",

 {
+  "add_bos_token": true,
+  "add_eos_token": false,
   "added_tokens_decoder": {
     "0": {
       "content": "<unk>",

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:095fc8eb570c7821109b5b43891161aeeef89ce935874d90a044aba098bf50f7
-size 4600

 version https://git-lfs.github.com/spec/v1
+oid sha256:e5f773561928a8d3f3c150edd166c479514c419cf88681d90ad020965d863cbf
+size 4728