File size: 2,506 Bytes
dc898ff
ae09be5
 
 
dc898ff
 
 
 
 
 
 
 
7185cdc
 
 
 
 
 
 
 
ae09be5
7185cdc
dc898ff
774edb1
cdc7003
774edb1
dc898ff
 
9c9963c
dc898ff
 
 
 
 
 
 
9c9963c
 
 
 
 
dc898ff
 
 
 
 
 
 
 
 
 
 
59847d9
dc898ff
 
 
ae09be5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
---
language:
- ru
- tyv
tags:
- language-classification
- russian
- tuvan
license: mit
metrics:
- accuracy
widget:
- text: >-
    В Туве приступили к разработке проектно-сметной документации новой котельной
    Шагонара
  example_title: Russian language
- text: >-
    Тыва Шагаан-Арыгга чаа котельная тудар төлевилел-санаашкын саавырларын кылып
    эгелээн
  example_title: Tuvan language
pipeline_tag: text-classification
library_name: sklearn
---

# Language Classifier

## Описание

Данная модель обучена для классификации тувинского или русского текста. Модель основана на логистической регрессии и использует TF-IDF векторизацию для преобразования текста в числовые признаки. Она может быть использована для определения языка текста, что особенно полезно для многоязычных приложений.

## Архитектура модели

Модель состоит из следующих компонентов:
- **TF-IDF Vectorizer**: Преобразует текстовые данные в векторные представления.
- **Logistic Regression**: Классификатор, обученный на данных, размеченных по языкам.


## Автор
Иргит Валерий Алдын-оолович


## Использование

Вы можете использовать эту модель для определения языка текста. Пример использования:

```python
from transformers import pipeline

# Загрузка модели и пайплайна
classifier = pipeline("text-classification", model="tuva/turu")

# Пример текстов для классификации
texts = ["В Туве приступили к разработке проектно-сметной документации новой котельной Шагонара", "Тыва Шагаан-Арыгга чаа котельная тудар төлевилел-санаашкын саавырларын кылып эгелээн"]

# Получение предсказаний
predictions = classifier(texts)
print(predictions)