Spaces:

data-silence
/

rus-news-classifier

Running

App Files Files Community

rus-news-classifier / app.py

data-silence

Update app.py

58f9bf8 verified 3 months ago

raw

history blame

2.11 kB

	import gradio as gr
	from transformers import AutoTokenizer, AutoModelForSequenceClassification
	import torch

	# Загрузка модели и токенизатора
	model_name = "data-silence/rus-news-classifier" # Замените на путь к вашей модели на HF
	tokenizer = AutoTokenizer.from_pretrained(model_name)
	model = AutoModelForSequenceClassification.from_pretrained(model_name)

	# Перевод модели в режим оценки
	device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
	model = model.to(device)
	model.eval()

	# Словарь для маппинга индексов на категории
	id2label = {
	0: 'climate', 1: 'conflicts', 2: 'culture', 3: 'economy', 4: 'gloss',
	5: 'health', 6: 'politics', 7: 'science', 8: 'society', 9: 'sports', 10: 'travel'
	}

	def predict(text):
	inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True).to(device)
	with torch.no_grad():
	outputs = model(**inputs)
	predicted_label_id = outputs.logits.argmax(-1).item()
	predicted_label = id2label[predicted_label_id]

	# Получаем вероятности для всех классов
	probabilities = torch.nn.functional.softmax(outputs.logits, dim=-1)
	probs_dict = {id2label[i]: float(prob) for i, prob in enumerate(probabilities[0])}

	return predicted_label, probs_dict

	# Создание интерфейса Gradio
	iface = gr.Interface(
	fn=predict,
	inputs=gr.Textbox(lines=5, label="Enter news text \| Введите текст новости"),
	outputs=[
	gr.Label(label="Predicted category \| Предсказанная категория"),
	gr.Label(label="Category probabilities \| Вероятности категорий")
	],
	title="News Classifier \| Классификатор новостей",
	description="Enter the news text in any language and the model will predict its category. \| Введите текст новости на любом языке, и модель предскажет её категорию"
	)

	iface.launch()