Spaces:
Sleeping
Sleeping
title: NLP Project | |
emoji: 🐢 | |
colorFrom: pink | |
colorTo: purple | |
sdk: streamlit | |
sdk_version: 1.21.0 | |
app_file: app.py | |
pinned: false | |
# NLP project | |
Данный проект является мультистраничным приложением для обработки естественного языка (Natural Language Processing) и был разработан с использованием платформы Hugging Face и фреймворка Streamlit. Проект включал следующих участников: Василий Севостянов, Анна Филина, Ильвир Хасанов, Иван Никифоров и Виктория Князева. | |
[Ознакомиться можно по ссылке](https://huggingface.co/spaces/vasevooo/NLP_project) | |
## 1. Классификация отзывов на фильмы на английском языке (Иван Никифоров) | |
В этой части проекта была разработана система классификации отзывов на фильмы на английском языке. Пользователь может ввести свой отзыв в поле ввода, после чего система предсказывает его класс (позитивный/негативный) с помощью трех моделей: | |
* Классический ML-алгоритм, обученный на представлении BagOfWords/TF-IDF. | |
* RNN или LSTM модель. | |
* BERT (мощная предобученная модель для работы с естественным языком). | |
Результаты предсказания каждой модели выводятся на экран вместе со временем, затраченным на их получение. | |
## 2. Генерация текста с использованием модели GPT (Ильвир Хасанов и Виктория Князева) | |
В данном разделе проекта была реализована генерация текста с использованием модели GPT (Generative Pre-trained Transformer). Пользователь может ввести определенное начало (prompt) текста, а также настроить параметры генерации, включая длину выходной последовательности и число генераций. Также можно контролировать температуру или использовать top-k и top-p (nucleus) для управления разнообразием и качеством генерируемого текста. | |
## 3. Модель question answering (Анна Филина и Василий Севостьянов) | |
В этой части проекта была разработана система вопросно-ответной обработки текста с использованием модели timpal0l/mdeberta-v3-base-squad2, обученной на данных SQuAD 2.0. Пользователь может ввести вопрос и контекст (в котором содержится ответ), и модель применяя алгоритм вопросно-ответного моделирования выведет ответ. | |
# NLP project | |
This project is a multipage application for Natural Language Processing (NLP) developed using the Hugging Face platform and the Streamlit framework. The project involved the following contributors: Vasily Sevostyanov, Anna Filina, Ilvir Khasanov, Ivan Nikiforov, and Victoria Knyazeva. | |
[You can read it by following this link](https://huggingface.co/spaces/vasevooo/NLP_project) | |
## 1. Film Review Classification in English (Ivan Nikiforov) | |
This part of the project focuses on classifying film reviews in English. Users can enter their reviews in the input field, and the system predicts the sentiment (positive/negative) using three models: | |
* Classic ML algorithm trained on BagOfWords/TF-IDF representation. | |
* RNN or LSTM model. | |
* BERT (a powerful pretrained model for natural language processing). | |
The predictions of each model are displayed along with the time taken to obtain them. | |
## 2. Text Generation using GPT Model (Ilvir Khasanov and Victoria Knyazeva) | |
In this section of the project, text generation is implemented using the GPT (Generative Pre-trained Transformer) model. Users can enter a specific starting prompt and adjust generation parameters, including the length of the output sequence and the number of generations. Temperature control or top-k and top-p (nucleus) methods can be used to manage the diversity and quality of the generated text. | |
## 3. Question Answering Model (Anna Filina and Vasily Sevostyanov) | |
This part of the project focuses on a question answering system using the timpal0l/mdeberta-v3-base-squad2 model, trained on the SQuAD 2.0 dataset. Users can input a question and the corresponding context containing the answer, and the model applies question answering algorithms to provide the answer. |