urfu-pe / mulyavin_aa /langdetector.py
mulyavinaa's picture
Создание API для моделей определения текста и перевода текста из Ru в En
82d4d7d
raw
history blame
No virus
1.28 kB
# Модуль определения языка
import transformers.pipelines.base
from transformers import pipeline
def load_text_detection_model() -> transformers.pipelines.base.Pipeline:
"""
Подгрузка модели детектора языка
:return: Класс пайплайна для модели детектора языка
"""
return pipeline("text-classification", model="papluca/xlm-roberta-base-language-detection")
def lang_detect(text: str,
langdetector: transformers.pipelines.base.Pipeline,
is_any: bool = False) -> str:
"""
Определение языка для введенного текста
:param text: Текст
:param langdetector: Пайплайн для модели детектора языка
:return: Код определенного языка (если определен)
"""
text_langs = list(langdetector(text, ))
if not text_langs:
return None
for i in range(3):
if i > len(text_langs) - 1:
break
print(text_langs[i])
if text_langs[i]['label'] in ['ru', 'en']:
return text_langs[i]['label']
if is_any:
return text_langs[i]['label']
return None