tuva
/

turu

Text Classification

language-classification

Model card Files Files and versions Community

turu / README.md

tuva's picture

Update README.md

9c9963c verified 7 months ago

|

2.54 kB

	---
	language:
	- ru
	- tyv
	tags:
	- language-classification
	- russian
	- tuvan
	datasets:
	- turu_corpuse.csv
	license: mit
	metrics:
	- accuracy
	widget:
	- text: >-
	В Туве приступили к разработке проектно-сметной документации новой котельной
	Шагонара
	example_title: Russian language
	- text: >-
	Тыва Шагаан-Арыгга чаа котельная тудар төлевилел-санаашкын саавырларын кылып
	эгелээн
	example_title: Tuvan language
	pipeline_tag: text-classification
	library_name: sklearn
	---

	# Language Classifier

	## Описание

	Данная модель обучена для классификации тувинского или русского текста. Модель основана на логистической регрессии и использует TF-IDF векторизацию для преобразования текста в числовые признаки. Она может быть использована для определения языка текста, что особенно полезно для многоязычных приложений.

	## Архитектура модели

	Модель состоит из следующих компонентов:
	- TF-IDF Vectorizer: Преобразует текстовые данные в векторные представления.
	- Logistic Regression: Классификатор, обученный на данных, размеченных по языкам.


	## Автор
	Иргит Валерий Алдын-оолович


	## Использование

	Вы можете использовать эту модель для определения языка текста. Пример использования:

	```python
	from transformers import pipeline

	# Загрузка модели и пайплайна
	classifier = pipeline("text-classification", model="tuva/turu")

	# Пример текстов для классификации
	texts = ["В Туве приступили к разработке проектно-сметной документации новой котельной Шагонара", "Тыва Шагаан-Арыгга чаа котельная тудар төлевилел-санаашкын саавырларын кылып эгелээн"]

	# Получение предсказаний
	predictions = classifier(texts)
	print(predictions)