Spaces:

yaswanthsai
/

live-coding-hr-assistant

Sleeping

live-coding-hr-assistant / app /model_handler.py

Yaswanth sai

changed the use of finetune

19a006f 11 days ago

4.31 kB

	from transformers import AutoTokenizer, AutoModelForCausalLM
	import torch
	from .utils import format_prompt_for_hint, format_prompt_for_followup, format_prompt_for_feedback
	from peft import PeftModel, PeftConfig

	MODEL_NAME = "Salesforce/codegen-350M-mono"
	# Use a relative path for the LoRA model, assuming it's in the project root
	LORA_PATH = "./fine-tuned-model"

	# Initialize the tokenizer
	tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, trust_remote_code=True)

	# Load the base model
	base_model = AutoModelForCausalLM.from_pretrained(
	MODEL_NAME,
	torch_dtype="auto",
	device_map="auto",
	trust_remote_code=True
	)

	# Load and apply the LoRA adapter
	model = PeftModel.from_pretrained(
	base_model,
	LORA_PATH,
	torch_dtype="auto",
	device_map="auto"
	)

	# Merge LoRA weights with base model for better inference performance
	model = model.merge_and_unload()

	def generate_hint(code_snippet, task_description, mode='concise'):
	prompt = format_prompt_for_hint(task_description, code_snippet, mode)
	print("--- PROMPT SENT TO MODEL ---")
	print(prompt)
	print("-----------------------------")
	inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
	outputs = model.generate(**inputs, max_new_tokens=128, do_sample=True, temperature=0.7)
	decoded_output = tokenizer.decode(outputs[0], skip_special_tokens=True)
	print("--- RAW MODEL OUTPUT ---")
	print(decoded_output)
	print("------------------------")
	# Extract only what comes after 'HINT:'
	if "HINT:" in decoded_output:
	hint = decoded_output.split("HINT:", 1)[-1].strip()
	for line in hint.splitlines():
	if line.strip():
	return line.strip()
	# Fallback: return first non-empty line not in prompt
	lines = [line.strip() for line in decoded_output.splitlines() if line.strip()]
	for line in lines:
	if "Task Description" not in line and "User's Code" not in line and "AI-HR Assistant" not in line:
	return line
	return ""

	def generate_feedback(code_snippet, task_description, mode='concise'):
	prompt = format_prompt_for_feedback(task_description, code_snippet, mode)
	print("--- PROMPT SENT TO MODEL (FEEDBACK) ---")
	print(prompt)
	print("---------------------------------------")
	inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
	outputs = model.generate(**inputs, max_new_tokens=256 if mode == 'detailed' else 128, do_sample=True, temperature=0.75)
	decoded_output = tokenizer.decode(outputs[0], skip_special_tokens=True)
	print("--- RAW MODEL OUTPUT (FEEDBACK) ---")
	print(decoded_output)
	print("-----------------------------------")
	# Extract only what comes after 'FEEDBACK:'
	if "FEEDBACK:" in decoded_output:
	feedback = decoded_output.split("FEEDBACK:", 1)[-1].strip()
	return feedback
	# Fallback: return first non-empty line not in prompt
	lines = [line.strip() for line in decoded_output.splitlines() if line.strip()]
	for line in lines:
	if "Task Description" not in line and "User's Code" not in line and "AI-HR Assistant" not in line:
	return line
	return ""

	def generate_follow_up(task_description, code_snippet):
	prompt = format_prompt_for_followup(task_description, code_snippet)
	print("--- PROMPT SENT TO MODEL ---")
	print(prompt)
	print("-----------------------------")
	inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
	outputs = model.generate(**inputs, max_new_tokens=128, do_sample=True, temperature=0.7)
	decoded_output = tokenizer.decode(outputs[0], skip_special_tokens=True)
	print("--- RAW MODEL OUTPUT ---")
	print(decoded_output)
	print("------------------------")
	# Extract only what comes after the prompt
	if prompt in decoded_output:
	followup = decoded_output.split(prompt, 1)[-1].strip()
	for line in followup.splitlines():
	if line.strip():
	return line.strip()
	# Fallback: return first non-empty line not in prompt
	lines = [line.strip() for line in decoded_output.splitlines() if line.strip()]
	for line in lines:
	if "Task Description" not in line and "User's Code" not in line and "AI-HR Assistant" not in line:
	return line
	return ""