Spaces:

Andreas99
/

LitBench-UI

Build error

Andreas99 commited on Mar 11

Commit

b093dc1

verified ·

1 Parent(s): 6aea200

Update src/train.py

Files changed (1) hide show

src/train.py CHANGED Viewed

@@ -6,7 +6,7 @@ import networkx as nx
 from tqdm import tqdm
 from peft import (LoraConfig, get_peft_model,
                   prepare_model_for_kbit_training)
-from transformers import AutoModelForCausalLM, AutoTokenizer
@@ -30,11 +30,17 @@ class QloraTrainer_CS:
         model_id = self.config['inference']["base_model"]
         print(model_id)
         tokenizer = AutoTokenizer.from_pretrained(model_id)
         tokenizer.model_max_length = self.config['training']['tokenizer']["max_length"]
         if not tokenizer.pad_token:
             tokenizer.pad_token = tokenizer.eos_token
-        model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.bfloat16)
         if model.device.type != 'cuda':
             model.to('cuda')

 from tqdm import tqdm
 from peft import (LoraConfig, get_peft_model,
                   prepare_model_for_kbit_training)
+from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
         model_id = self.config['inference']["base_model"]
         print(model_id)
+        bnb_config = BitsAndBytesConfig(
+            load_in_8bit=True,
+            bnb_8bit_use_double_quant=True,
+            bnb_8bit_quant_type="nf8",
+            bnb_8bit_compute_dtype=torch.bfloat16
+        )
         tokenizer = AutoTokenizer.from_pretrained(model_id)
         tokenizer.model_max_length = self.config['training']['tokenizer']["max_length"]
         if not tokenizer.pad_token:
             tokenizer.pad_token = tokenizer.eos_token
+        model = AutoModelForCausalLM.from_pretrained(model_id, quantization_config=bnb_config, torch_dtype=torch.bfloat16)
         if model.device.type != 'cuda':
             model.to('cuda')