MonoHime commited on
Commit
4957f45
1 Parent(s): bb282eb

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +53 -0
README.md ADDED
@@ -0,0 +1,53 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - ru
4
+ tags:
5
+ - sentiment
6
+ - text-classification
7
+ ---
8
+
9
+ # Keras model with ruBERT conversational embedder for Sentiment Analysis
10
+ Russian texts sentiment classification.
11
+
12
+ Model trained on [Tatyana/ru_sentiment_dataset](https://huggingface.co/datasets/Tatyana/ru_sentiment_dataset)
13
+
14
+ ## Labels meaning
15
+ 0: NEUTRAL
16
+ 1: POSITIVE
17
+ 2: NEGATIVE
18
+
19
+ ## How to use
20
+ ```python
21
+
22
+ !pip install tensorflow-gpu
23
+ !pip install deeppavlov
24
+ !python -m deeppavlov install squad_bert
25
+ !pip install fasttext
26
+ !pip install transformers
27
+ !python -m deeppavlov install bert_sentence_embedder
28
+
29
+ from deeppavlov import build_model
30
+
31
+ model = build_model(path_to_config/custom_config.json)
32
+ model(["Сегодня хорошая погода", "Я счастлив проводить с тобою время", "Мне нравится эта музыкальная композиция"])
33
+
34
+ ```
35
+
36
+
37
+ ## Datasets used for model training
38
+
39
+ **[RuTweetCorp](https://study.mokoron.com/)**
40
+
41
+ > Рубцова Ю. Автоматическое построение и анализ корпуса коротких текстов (постов микроблогов) для задачи разработки и тренировки тонового классификатора //Инженерия знаний и технологии семантического веба. – 2012. – Т. 1. – С. 109-116.
42
+
43
+ **[RuReviews](https://github.com/sismetanin/rureviews)**
44
+
45
+ > RuReviews: An Automatically Annotated Sentiment Analysis Dataset for Product Reviews in Russian.
46
+
47
+ **[RuSentiment](http://text-machine.cs.uml.edu/projects/rusentiment/)**
48
+
49
+ > A. Rogers A. Romanov A. Rumshisky S. Volkova M. Gronas A. Gribov RuSentiment: An Enriched Sentiment Analysis Dataset for Social Media in Russian. Proceedings of COLING 2018.
50
+
51
+ **[Отзывы о медучреждениях](https://github.com/blanchefort/datasets/tree/master/medical_comments)**
52
+
53
+ > Датасет содержит пользовательские отзывы о медицинских учреждениях. Датасет собран в мае 2019 года с сайта prodoctorov.ru