Spaces:

rootxhacker
/

CodeAstra-7B-demo

Sleeping

rootxhacker commited on 12 days ago

Commit

2e03541

•

1 Parent(s): a04d31e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,23 +4,23 @@ from transformers import AutoModelForCausalLM, AutoTokenizer
 import gradio as gr
 import spaces
-@spaces.GPU(duration=200)
-def get_completion(query, model, tokenizer):
-    peft_model_id = "rootxhacker/CodeAstra-7B"
-    config = PeftConfig.from_pretrained(peft_model_id)
-    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
-    model = AutoModelForCausalLM.from_pretrained(
     config.base_model_name_or_path,
     return_dict=True,
     load_in_4bit=True,
     device_map="auto"  # This will automatically handle device placement
     )
-    tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)
-    model = PeftModel.from_pretrained(model, peft_model_id)
     inputs = tokenizer(query, return_tensors="pt").to(device)  # Move inputs to the same device as the model
     outputs = model.generate(**inputs, max_new_tokens=512, do_sample=True, temperature=0.7)
     return tokenizer.decode(outputs[0], skip_special_tokens=True)

 import gradio as gr
 import spaces
+peft_model_id = "rootxhacker/CodeAstra-7B"
+config = PeftConfig.from_pretrained(peft_model_id)
+device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+model = AutoModelForCausalLM.from_pretrained(
     config.base_model_name_or_path,
     return_dict=True,
     load_in_4bit=True,
     device_map="auto"  # This will automatically handle device placement
     )
+tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)
+model = PeftModel.from_pretrained(model, peft_model_id)
+@spaces.GPU(duration=200)
+def get_completion(query, model, tokenizer):
     inputs = tokenizer(query, return_tensors="pt").to(device)  # Move inputs to the same device as the model
     outputs = model.generate(**inputs, max_new_tokens=512, do_sample=True, temperature=0.7)
     return tokenizer.decode(outputs[0], skip_special_tokens=True)