Spaces:

parsanna17
/

Rgenerator

Sleeping

parsanna17 commited on Mar 29

Commit

661fe9a

•

1 Parent(s): bed7540

updated quantization config

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,15 +1,16 @@
 import gradio as gr
 import torch
 from peft import PeftModel, PeftConfig
-from transformers import AutoTokenizer, AutoModelForCausalLM
 #Loading model
 model_path = "parsanna17/finetune_starcoder2_with_R_data"
 checkpoint = "bigcode/starcoder2-3b"
-device = "cuda" if torch.cuda.is_available() else "cpu"
 config = PeftConfig.from_pretrained(model_path)
-model = AutoModelForCausalLM.from_pretrained(checkpoint , device_map=device, torch_dtype=torch.bfloat16)
 model = PeftModel.from_pretrained(model, model_path).to(device)
 tokenizer = AutoTokenizer.from_pretrained(checkpoint)

 import gradio as gr
 import torch
 from peft import PeftModel, PeftConfig
+from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
 #Loading model
+quantization_config = BitsAndBytesConfig(load_in_4bit=True)
 model_path = "parsanna17/finetune_starcoder2_with_R_data"
 checkpoint = "bigcode/starcoder2-3b"
 config = PeftConfig.from_pretrained(model_path)
+model = AutoModelForCausalLM.from_pretrained(checkpoint, quantization_config=quantization_config)
 model = PeftModel.from_pretrained(model, model_path).to(device)
 tokenizer = AutoTokenizer.from_pretrained(checkpoint)