Create README.md
Browse files
README.md
ADDED
@@ -0,0 +1,53 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
language:
|
3 |
+
- ru
|
4 |
+
tags:
|
5 |
+
- sentiment
|
6 |
+
- text-classification
|
7 |
+
---
|
8 |
+
|
9 |
+
# Keras model with ruBERT conversational embedder for Sentiment Analysis
|
10 |
+
Russian texts sentiment classification.
|
11 |
+
|
12 |
+
Model trained on [Tatyana/ru_sentiment_dataset](https://huggingface.co/datasets/Tatyana/ru_sentiment_dataset)
|
13 |
+
|
14 |
+
## Labels meaning
|
15 |
+
0: NEUTRAL
|
16 |
+
1: POSITIVE
|
17 |
+
2: NEGATIVE
|
18 |
+
|
19 |
+
## How to use
|
20 |
+
```python
|
21 |
+
|
22 |
+
!pip install tensorflow-gpu
|
23 |
+
!pip install deeppavlov
|
24 |
+
!python -m deeppavlov install squad_bert
|
25 |
+
!pip install fasttext
|
26 |
+
!pip install transformers
|
27 |
+
!python -m deeppavlov install bert_sentence_embedder
|
28 |
+
|
29 |
+
from deeppavlov import build_model
|
30 |
+
|
31 |
+
model = build_model(path_to_config/custom_config.json)
|
32 |
+
model(["Сегодня хорошая погода", "Я счастлив проводить с тобою время", "Мне нравится эта музыкальная композиция"])
|
33 |
+
|
34 |
+
```
|
35 |
+
|
36 |
+
|
37 |
+
## Datasets used for model training
|
38 |
+
|
39 |
+
**[RuTweetCorp](https://study.mokoron.com/)**
|
40 |
+
|
41 |
+
> Рубцова Ю. Автоматическое построение и анализ корпуса коротких текстов (постов микроблогов) для задачи разработки и тренировки тонового классификатора //Инженерия знаний и технологии семантического веба. – 2012. – Т. 1. – С. 109-116.
|
42 |
+
|
43 |
+
**[RuReviews](https://github.com/sismetanin/rureviews)**
|
44 |
+
|
45 |
+
> RuReviews: An Automatically Annotated Sentiment Analysis Dataset for Product Reviews in Russian.
|
46 |
+
|
47 |
+
**[RuSentiment](http://text-machine.cs.uml.edu/projects/rusentiment/)**
|
48 |
+
|
49 |
+
> A. Rogers A. Romanov A. Rumshisky S. Volkova M. Gronas A. Gribov RuSentiment: An Enriched Sentiment Analysis Dataset for Social Media in Russian. Proceedings of COLING 2018.
|
50 |
+
|
51 |
+
**[Отзывы о медучреждениях](https://github.com/blanchefort/datasets/tree/master/medical_comments)**
|
52 |
+
|
53 |
+
> Датасет содержит пользовательские отзывы о медицинских учреждениях. Датасет собран в мае 2019 года с сайта prodoctorov.ru
|