File size: 1,044 Bytes
2196ee1 f2ccb1b 2196ee1 f2ccb1b 1909fb2 0a98003 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 |
---
license: apache-2.0
datasets:
- Den4ikAI/gibberish_dataset
language:
- ru
pipeline_tag: text-classification
widget:
- text: 'йыйлощойщ щйоащощ шо923ш шзщйвзчжда?'
- text: 'колонок настроен на транса в рот.'
- text: 'я помню чудное мгновенье.'
---
Модель обучена классифицировать текст на 3 класса:
1. OK - текст нормальный
2. Neural_shit - текст содержит ошибки в склонениях, является несвязным набором слов или результатом работы бота-рерайтера
3. face_on_keyboard - текст абсолютно не имеет смысла.
Пример кода инференса:
```python
from transformers import pipeline
classifier = pipeline("text-classification", model="Den4ikAI/nonsense_gibberish_detector")
while 1:
print(classifier(input(":> ")))
```
Blogpost: [link](https://t.me/den4ikresearch/9) |