Spaces:

saifeddinemk
/

cv_job

Sleeping

saifeddinemk commited on 8 days ago

Commit

71a0d39

•

1 Parent(s): 91207a8

Init app

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,10 +10,12 @@ app = FastAPI()
 base_model_name = "akjindal53244/Llama-3.1-Storm-8B"
 peft_model_id = "LlamaFactoryAI/cv-job-description-matching"
-base_model = AutoModelForCausalLM.from_pretrained(base_model_name)
 tokenizer = AutoTokenizer.from_pretrained(base_model_name)
 config = PeftConfig.from_pretrained(peft_model_id)
-model = PeftModel.from_pretrained(base_model, peft_model_id)
 # Define request model
 class AnalysisRequest(BaseModel):
@@ -45,7 +47,7 @@ async def analyze(request: AnalysisRequest):
         # Tokenize and generate response
         inputs = tokenizer(input_text, return_tensors="pt")
-        outputs = model.generate(**inputs, max_new_tokens=128)
         generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
         return {"analysis": generated_text}

 base_model_name = "akjindal53244/Llama-3.1-Storm-8B"
 peft_model_id = "LlamaFactoryAI/cv-job-description-matching"
+base_model = AutoModelForCausalLM.from_pretrained(base_model_name, torch_dtype=torch.float16)
+model = PeftModel.from_pretrained(base_model, peft_model_id, torch_dtype=torch.float16)
 tokenizer = AutoTokenizer.from_pretrained(base_model_name)
 config = PeftConfig.from_pretrained(peft_model_id)
 # Define request model
 class AnalysisRequest(BaseModel):
         # Tokenize and generate response
         inputs = tokenizer(input_text, return_tensors="pt")
+        outputs = model.generate(**inputs, max_new_tokens=64)
         generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
         return {"analysis": generated_text}