Spaces:

rivapereira123
/

firstaid

Sleeping

rivapereira123 commited on Jul 14

Commit

0f5217f

verified ·

1 Parent(s): 0c2c20e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -564,11 +564,11 @@ class EnhancedGazaRAGSystem:
             # Enhanced quantization configuration
             quantization_config = BitsAndBytesConfig(
                 load_in_4bit=True,
-                bnb_4bit_compute_dtype=torch.float16,
                 bnb_4bit_use_double_quant=True,
                 bnb_4bit_quant_type="nf4",
-                bnb_4bit_quant_storage=torch.uint8
             )
             self.tokenizer = AutoTokenizer.from_pretrained(
                 model_name,

             # Enhanced quantization configuration
             quantization_config = BitsAndBytesConfig(
                 load_in_4bit=True,
                 bnb_4bit_use_double_quant=True,
                 bnb_4bit_quant_type="nf4",
+                bnb_4bit_compute_dtype=torch.float16,
             )
             self.tokenizer = AutoTokenizer.from_pretrained(
                 model_name,