qresearch
/

llama-3-vision-alpha-hf

Image-Text-to-Text

text-generation

Model card Files Files and versions Community

qtnx commited on May 19

Commit

d806c78

•

1 Parent(s): 8904048

Update README.md

Files changed (1) hide show

README.md +13 -2

README.md CHANGED Viewed

@@ -23,11 +23,22 @@ pip install torch transformers pillow
 import torch
 from PIL import Image
 from transformers import AutoModelForCausalLM, AutoTokenizer
 model_id = "qresearch/llama-3-vision-alpha-hf"
 model = AutoModelForCausalLM.from_pretrained(
-    model_id, trust_remote_code=True, torch_dtype=torch.float16
-).to("cuda")
 tokenizer = AutoTokenizer.from_pretrained(
     model_id,

 import torch
 from PIL import Image
 from transformers import AutoModelForCausalLM, AutoTokenizer
+from transformers import BitsAndBytesConfig
+bnb_cfg = BitsAndBytesConfig(
+    load_in_4bit=True,
+    bnb_4bit_compute_dtype=torch.float16,
+    llm_int8_skip_modules=["mm_projector", "vision_model"],
+)
 model_id = "qresearch/llama-3-vision-alpha-hf"
 model = AutoModelForCausalLM.from_pretrained(
+    model_name,
+    trust_remote_code=True,
+    torch_dtype=torch.float16,
+    quantization_config=bnb_cfg,
+)
 tokenizer = AutoTokenizer.from_pretrained(
     model_id,