Spaces:
Sleeping
Sleeping
Update README.md
#6
by
annafilina
- opened
README.md
CHANGED
@@ -9,4 +9,46 @@ app_file: app.py
|
|
9 |
pinned: false
|
10 |
---
|
11 |
|
12 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
9 |
pinned: false
|
10 |
---
|
11 |
|
12 |
+
# NLP project
|
13 |
+
|
14 |
+
Данный проект является мультистраничным приложением для обработки естественного языка (Natural Language Processing) и был разработан с использованием платформы Hugging Face и фреймворка Streamlit. Проект включал следующих участников: Василий Севостянов, Анна Филина, Ильвир Хасанов, Иван Никифоров и Виктория Князева.
|
15 |
+
|
16 |
+
## 1. Классификация отзывов на фильмы на английском языке (Иван Никифоров)
|
17 |
+
|
18 |
+
В этой части проекта была разработана система классификации отзывов на фильмы на английском языке. Пользователь может ввести свой отзыв в поле ввода, после чего система предсказывает его класс (позитивный/негативный) с помощью трех моделей:
|
19 |
+
|
20 |
+
* Классический ML-алгоритм, обученный на представлении BagOfWords/TF-IDF.
|
21 |
+
* RNN или LSTM модель.
|
22 |
+
* BERT (мощная предобученная модель для работы с естественным языком).
|
23 |
+
|
24 |
+
Результаты предсказания каждой модели выводятся на экран вместе со временем, затраченным на их получение.
|
25 |
+
|
26 |
+
## 2. Генерация текста с использованием модели GPT (Ильвир Хасанов и Виктория Князева)
|
27 |
+
|
28 |
+
В данном разделе проекта была реализована генерация текста с использованием модели GPT (Generative Pre-trained Transformer). Пользователь может ввести определенное начало (prompt) текста, а также настроить параметры генерации, включая длину выходной последовательности и число генераций. Также можно контролировать температуру или использовать top-k и top-p (nucleus) для управления разнообразием и качеством генерируемого текста.
|
29 |
+
|
30 |
+
## 3. Модель question answering (Анна Филина и Василий Севостьянов)
|
31 |
+
|
32 |
+
В этой части проекта была разработана система вопросно-ответной обработки текста с использованием модели timpal0l/mdeberta-v3-base-squad2 от Hugging Face, обученной на данных SQuAD 2.0. Пользователь может ввести вопрос и контекст (в котором содержится ответ), и модель применяя алгоритм вопросно-ответного моделирования выведет ответ.
|
33 |
+
|
34 |
+
# NLP project
|
35 |
+
|
36 |
+
This project is a multipage application for Natural Language Processing (NLP) developed using the Hugging Face platform and the Streamlit framework. The project involved the following contributors: Vasily Sevostyanov, Anna Filina, Ilvir Khasanov, Ivan Nikiforov, and Victoria Knyazeva.
|
37 |
+
|
38 |
+
## 1. Film Review Classification in English (Ivan Nikiforov)
|
39 |
+
|
40 |
+
This part of the project focuses on classifying film reviews in English. Users can enter their reviews in the input field, and the system predicts the sentiment (positive/negative) using three models:
|
41 |
+
|
42 |
+
* Classic ML algorithm trained on BagOfWords/TF-IDF representation.
|
43 |
+
* RNN or LSTM model.
|
44 |
+
* BERT (a powerful pretrained model for natural language processing).
|
45 |
+
|
46 |
+
The predictions of each model are displayed along with the time taken to obtain them.
|
47 |
+
|
48 |
+
## 2. Text Generation using GPT Model (Ilvir Khasanov and Victoria Knyazeva)
|
49 |
+
|
50 |
+
In this section of the project, text generation is implemented using the GPT (Generative Pre-trained Transformer) model. Users can enter a specific starting prompt and adjust generation parameters, including the length of the output sequence and the number of generations. Temperature control or top-k and top-p (nucleus) methods can be used to manage the diversity and quality of the generated text.
|
51 |
+
|
52 |
+
## 3. Question Answering Model (Anna Filina and Vasily Sevostyanov)
|
53 |
+
|
54 |
+
This part of the project focuses on a question answering system using the timpal0l/mdeberta-v3-base-squad2 model from Hugging Face, trained on the SQuAD 2.0 dataset. Users can input a question and the corresponding context containing the answer, and the model applies question answering algorithms to provide the answer.
|