Spaces:

Dovakiins
/

qwerrwe

Build error

App Files Files Community

winglian commited on May 11, 2023

Commit

165da58

•

1 Parent(s): 4cc7ed8

fix config for parity with previous change

Browse files

https://github.com/OpenAccess-AI-Collective/axolotl/commit/5159d00a86ef7c358aa819d0bafadd1d5d8304e8\#diff-65b4693504c4e8ffac76c7f2c90913faee381f802cf64e7f49c995a2134ed3b3R164

Files changed (6) hide show

configs/galactica_1_3B.yml +1 -1
configs/llama_7B_jeopardy.yml +1 -1
configs/stability_3b.yml +1 -1
examples/4bit-lora-7b/config.yml +1 -1
examples/mpt-7b/config.yml +3 -4
examples/redpajama/config-3b.yml +1 -1

configs/galactica_1_3B.yml CHANGED Viewed

@@ -34,7 +34,7 @@ tf32: false
 early_stopping_patience:
 resume_from_checkpoint:
 local_rank:
-special_tokens:
   pad_token: "[PAD]"
   bos_token: "<s>"
   eos_token: "</s>"

 early_stopping_patience:
 resume_from_checkpoint:
 local_rank:
+tokens:
   pad_token: "[PAD]"
   bos_token: "<s>"
   eos_token: "</s>"

configs/llama_7B_jeopardy.yml CHANGED Viewed

@@ -51,7 +51,7 @@ deepspeed:
 weight_decay: 0.0001
 fsdp:
 fsdp_config:
-special_tokens:
   pad_token: "[PAD]"
   bos_token: "<s>"
   eos_token: "</s>"

 weight_decay: 0.0001
 fsdp:
 fsdp_config:
+tokens:
   pad_token: "[PAD]"
   bos_token: "<s>"
   eos_token: "</s>"

configs/stability_3b.yml CHANGED Viewed

@@ -49,7 +49,7 @@ deepspeed:
 weight_decay: 0.01
 fsdp:
 fsdp_config:
-#special_tokens:
 #  pad_token: "[PAD]"
 #  bos_token: "<s>"
 #  eos_token: "</s>"

 weight_decay: 0.01
 fsdp:
 fsdp_config:
+#tokens:
 #  pad_token: "[PAD]"
 #  bos_token: "<s>"
 #  eos_token: "</s>"

examples/4bit-lora-7b/config.yml CHANGED Viewed

@@ -55,7 +55,7 @@ deepspeed:
 weight_decay: 0.0001
 fsdp:
 fsdp_config:
-special_tokens:
   pad_token: "[PAD]"
   bos_token: "<s>"
   eos_token: "</s>"

 weight_decay: 0.0001
 fsdp:
 fsdp_config:
+tokens:
   pad_token: "[PAD]"
   bos_token: "<s>"
   eos_token: "</s>"

examples/mpt-7b/config.yml CHANGED Viewed

@@ -1,7 +1,6 @@
 base_model: mosaicml/mpt-7b
 base_model_config: mosaicml/mpt-7b
-model_type: AutoModelForCausalLM
-tokenizer_type: GPTNeoXTokenizer
 trust_remote_code: true  # required for mpt as their model class is not merged into transformers yet
 load_in_8bit: false
 datasets:
@@ -25,7 +24,7 @@ wandb_watch:
 wandb_run_id:
 wandb_log_model: checkpoint
 output_dir: ./mpt-alpaca-7b
-batch_size: 4
 micro_batch_size: 1
 num_epochs: 3
 optimizer: adamw_bnb_8bit
@@ -52,7 +51,7 @@ deepspeed:
 weight_decay: 0.0001
 fsdp:
 fsdp_config:
-special_tokens:
   pad_token: "<|padding|>"
   bos_token: "<|endoftext|>"
   eos_token: "<|endoftext|>"

 base_model: mosaicml/mpt-7b
 base_model_config: mosaicml/mpt-7b
+tokenizer_type: AutoTokenizer
 trust_remote_code: true  # required for mpt as their model class is not merged into transformers yet
 load_in_8bit: false
 datasets:
 wandb_run_id:
 wandb_log_model: checkpoint
 output_dir: ./mpt-alpaca-7b
+batch_size: 1
 micro_batch_size: 1
 num_epochs: 3
 optimizer: adamw_bnb_8bit
 weight_decay: 0.0001
 fsdp:
 fsdp_config:
+tokens:
   pad_token: "<|padding|>"
   bos_token: "<|endoftext|>"
   eos_token: "<|endoftext|>"

examples/redpajama/config-3b.yml CHANGED Viewed

@@ -52,7 +52,7 @@ deepspeed:
 weight_decay: 0.0001
 fsdp:
 fsdp_config:
-special_tokens:
   pad_token: "<|padding|>"
   bos_token: "<|endoftext|>"
   eos_token: "<|endoftext|>"

 weight_decay: 0.0001
 fsdp:
 fsdp_config:
+tokens:
   pad_token: "<|padding|>"
   bos_token: "<|endoftext|>"
   eos_token: "<|endoftext|>"