menimeni123
/

helem-llm

Model card Files Files and versions Community

helem-llm / handler.py

menimeni123's picture

entrophy method

60fbaa9 8 months ago

2.13 kB

	import os
	import joblib
	import torch
	import numpy as np
	from transformers import DistilBertTokenizerFast, DistilBertForSequenceClassification
	import torch.nn.functional as F

	class EndpointHandler:
	def __init__(self, model_dir):
	self.model = DistilBertForSequenceClassification.from_pretrained(model_dir)
	self.tokenizer = DistilBertTokenizerFast.from_pretrained(model_dir)
	self.label_mapping = joblib.load(os.path.join(model_dir, "label_mapping.joblib"))
	self.labels = {v: k for k, v in self.label_mapping.items()}

	def __call__(self, inputs):
	if isinstance(inputs, dict) and 'inputs' in inputs:
	return self.predict(inputs['inputs'])
	return self.predict(inputs)

	def predict(self, text):
	# Tokenize and encode the input
	encoded_input = self.tokenizer(text, return_tensors='pt', truncation=True, max_length=512)

	# Get model prediction
	with torch.no_grad():
	outputs = self.model(**encoded_input)
	logits = outputs.logits

	# Get probabilities
	probabilities = F.softmax(logits, dim=-1).squeeze().numpy()

	# Get predicted class and confidence
	predicted_class_idx = np.argmax(probabilities)
	predicted_label = self.labels[predicted_class_idx]
	confidence = probabilities[predicted_class_idx]

	# Additional analysis
	entropy = -np.sum(probabilities * np.log(probabilities + 1e-9))
	max_prob_ratio = np.max(probabilities) / np.sort(probabilities)[-2]

	# Adjust confidence based on entropy and probability ratio
	adjusted_confidence = confidence * (1 - entropy/np.log(len(probabilities))) * max_prob_ratio

	# Lower the confidence for very short inputs
	if len(text.split()) < 4:
	adjusted_confidence *= 0.5

	return {
	"label": predicted_label,
	"score": float(adjusted_confidence),
	"raw_scores": {label: float(prob) for label, prob in zip(self.labels.values(), probabilities)}
	}

	def get_pipeline():
	return EndpointHandler