Spaces:

Veronika1101
/

Nlp_proj

Running

App Files Files Community

Nlp_proj / Models /toxic1.py

Veronika1101

Upload 20 files

d15a7ed verified 2 months ago

raw history blame contribute delete

No virus

1.93 kB

	# toxic.py
	import streamlit as st
	import numpy as np
	import pandas as pd
	import time
	import torch
	from transformers import AutoTokenizer, AutoModelForSequenceClassification

	model_t_checkpoint = 'cointegrated/rubert-tiny-toxicity'
	tokenizer_t = AutoTokenizer.from_pretrained(model_t_checkpoint)
	model_t = AutoModelForSequenceClassification.from_pretrained(model_t_checkpoint)

	def text2toxicity(text, aggregate=True):
	with torch.no_grad():
	inputs = tokenizer_t(text, return_tensors='pt', truncation=True, padding=True).to('cpu')
	proba = torch.sigmoid(model_t(**inputs).logits).cpu().numpy()
	if isinstance(text, str):
	proba = proba[0]
	if aggregate:
	return 1 - proba.T[0] * (1 - proba.T[-1])
	return proba

	def toxicity_page():
	st.title("""
	Определим токсичный комментарий или нет
	""")
	user_text_input = st.text_area('Введите ваш отзыв здесь:')

	if st.button('Предсказать'):
	start_time = time.time()
	proba = text2toxicity(user_text_input, True)
	end_time = time.time()
	prediction_time = end_time - start_time

	if proba >= 0.5:
	st.write(f'Степень токсичности комментария: {round(proba, 2)} – комментарий токсичный.')
	st.image('Data/maxresdefault.jpg')
	else:
	st.write(f'Степень токсичности комментария: {round(proba, 2)} – комментарий не токсичный.')
	st.image('Data/c793397a-39df-5ff7-8137-e59568352c11.jpeg')
	st.write(f'Время предсказания: {prediction_time:.4f} секунд')

	st.markdown("<h3 style='font-size: 18px;'>Ссылка на Токсичный бот</h3>", unsafe_allow_html=True)
	st.markdown("[Токсичный бот](https://t.me/toxic1101_bot)")