File size: 2,506 Bytes
dc898ff ae09be5 dc898ff 7185cdc ae09be5 7185cdc dc898ff 774edb1 cdc7003 774edb1 dc898ff 9c9963c dc898ff 9c9963c dc898ff 59847d9 dc898ff ae09be5 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 |
---
language:
- ru
- tyv
tags:
- language-classification
- russian
- tuvan
license: mit
metrics:
- accuracy
widget:
- text: >-
В Туве приступили к разработке проектно-сметной документации новой котельной
Шагонара
example_title: Russian language
- text: >-
Тыва Шагаан-Арыгга чаа котельная тудар төлевилел-санаашкын саавырларын кылып
эгелээн
example_title: Tuvan language
pipeline_tag: text-classification
library_name: sklearn
---
# Language Classifier
## Описание
Данная модель обучена для классификации тувинского или русского текста. Модель основана на логистической регрессии и использует TF-IDF векторизацию для преобразования текста в числовые признаки. Она может быть использована для определения языка текста, что особенно полезно для многоязычных приложений.
## Архитектура модели
Модель состоит из следующих компонентов:
- **TF-IDF Vectorizer**: Преобразует текстовые данные в векторные представления.
- **Logistic Regression**: Классификатор, обученный на данных, размеченных по языкам.
## Автор
Иргит Валерий Алдын-оолович
## Использование
Вы можете использовать эту модель для определения языка текста. Пример использования:
```python
from transformers import pipeline
# Загрузка модели и пайплайна
classifier = pipeline("text-classification", model="tuva/turu")
# Пример текстов для классификации
texts = ["В Туве приступили к разработке проектно-сметной документации новой котельной Шагонара", "Тыва Шагаан-Арыгга чаа котельная тудар төлевилел-санаашкын саавырларын кылып эгелээн"]
# Получение предсказаний
predictions = classifier(texts)
print(predictions) |