Spaces:

Dovakiins
/

qwerrwe

Build error

winglian commited on Nov 30, 2023

Commit

3e3229e

•

1 Parent(s): 1d21aa6

fix for qwen w lora (#906)

Files changed (1) hide show

src/axolotl/utils/models.py CHANGED Viewed

@@ -412,15 +412,22 @@ def load_model(
                 module.to(torch.float32)
     needs_fa2_dtype = cfg.adapter or cfg.fsdp
     if (cfg.adapter == "lora" and load_in_8bit) or (
         cfg.adapter == "qlora" and cfg.load_in_4bit
     ):
         LOG.info("converting PEFT model w/ prepare_model_for_kbit_training")
         if cfg.gradient_checkpointing:
             model.gradient_checkpointing_enable()
-        model = prepare_model_for_kbit_training(
-            model, use_gradient_checkpointing=cfg.gradient_checkpointing
-        )
         needs_fa2_dtype = True
     # LlamaRMSNorm layers are in fp32 after kbit_training or full finetune, so we need to

                 module.to(torch.float32)
     needs_fa2_dtype = cfg.adapter or cfg.fsdp
+    skip_prepare_model_for_kbit_training = False
+    if cfg.model_config_type == "qwen" and cfg.adapter == "lora":
+        # Qwen doesn't play nicely with LoRA if this is enabled
+        skip_prepare_model_for_kbit_training = True
     if (cfg.adapter == "lora" and load_in_8bit) or (
         cfg.adapter == "qlora" and cfg.load_in_4bit
     ):
         LOG.info("converting PEFT model w/ prepare_model_for_kbit_training")
         if cfg.gradient_checkpointing:
             model.gradient_checkpointing_enable()
+        if not skip_prepare_model_for_kbit_training:
+            model = prepare_model_for_kbit_training(
+                model, use_gradient_checkpointing=cfg.gradient_checkpointing
+            )
         needs_fa2_dtype = True
     # LlamaRMSNorm layers are in fp32 after kbit_training or full finetune, so we need to