Files changed (1) hide show
  1. README.md +43 -1
README.md CHANGED
@@ -9,4 +9,46 @@ app_file: app.py
9
  pinned: false
10
  ---
11
 
12
- Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
9
  pinned: false
10
  ---
11
 
12
+ # NLP project
13
+
14
+ Данный проект является мультистраничным приложением для обработки естественного языка (Natural Language Processing) и был разработан с использованием платформы Hugging Face и фреймворка Streamlit. Проект включал следующих участников: Василий Севостянов, Анна Филина, Ильвир Хасанов, Иван Никифоров и Виктория Князева.
15
+
16
+ ## 1. Классификация отзывов на фильмы на английском языке (Иван Никифоров)
17
+
18
+ В этой части проекта была разработана система классификации отзывов на фильмы на английском языке. Пользователь может ввести свой отзыв в поле ввода, после чего система предсказывает его класс (позитивный/негативный) с помощью трех моделей:
19
+
20
+ * Классический ML-алгоритм, обученный на представлении BagOfWords/TF-IDF.
21
+ * RNN или LSTM модель.
22
+ * BERT (мощная предобученная модель для работы с естественным языком).
23
+
24
+ Результаты предсказания каждой модели выводятся на экран вместе со временем, затраченным на их получение.
25
+
26
+ ## 2. Генерация текста с использованием модели GPT (Ильвир Хасанов и Виктория Князева)
27
+
28
+ В данном разделе проекта была реализована генерация текста с использованием модели GPT (Generative Pre-trained Transformer). Пользователь может ввести определенное начало (prompt) текста, а также настроить параметры генерации, включая длину выходной последовательности и число генераций. Также можно контролировать температуру или использовать top-k и top-p (nucleus) для управления разнообразием и качеством генерируемого текста.
29
+
30
+ ## 3. Модель question answering (Анна Филина и Василий Севостьянов)
31
+
32
+ В этой части проекта была разработана система вопросно-ответной обработки текста с использованием модели timpal0l/mdeberta-v3-base-squad2 от Hugging Face, обученной на данных SQuAD 2.0. Пользователь может ввести вопрос и контекст (в котором содержится ответ), и модель применяя алгоритм вопросно-ответного моделирования выведет ответ.
33
+
34
+ # NLP project
35
+
36
+ This project is a multipage application for Natural Language Processing (NLP) developed using the Hugging Face platform and the Streamlit framework. The project involved the following contributors: Vasily Sevostyanov, Anna Filina, Ilvir Khasanov, Ivan Nikiforov, and Victoria Knyazeva.
37
+
38
+ ## 1. Film Review Classification in English (Ivan Nikiforov)
39
+
40
+ This part of the project focuses on classifying film reviews in English. Users can enter their reviews in the input field, and the system predicts the sentiment (positive/negative) using three models:
41
+
42
+ * Classic ML algorithm trained on BagOfWords/TF-IDF representation.
43
+ * RNN or LSTM model.
44
+ * BERT (a powerful pretrained model for natural language processing).
45
+
46
+ The predictions of each model are displayed along with the time taken to obtain them.
47
+
48
+ ## 2. Text Generation using GPT Model (Ilvir Khasanov and Victoria Knyazeva)
49
+
50
+ In this section of the project, text generation is implemented using the GPT (Generative Pre-trained Transformer) model. Users can enter a specific starting prompt and adjust generation parameters, including the length of the output sequence and the number of generations. Temperature control or top-k and top-p (nucleus) methods can be used to manage the diversity and quality of the generated text.
51
+
52
+ ## 3. Question Answering Model (Anna Filina and Vasily Sevostyanov)
53
+
54
+ This part of the project focuses on a question answering system using the timpal0l/mdeberta-v3-base-squad2 model from Hugging Face, trained on the SQuAD 2.0 dataset. Users can input a question and the corresponding context containing the answer, and the model applies question answering algorithms to provide the answer.