---
library_name: transformers
tags:
- legal
license: apache-2.0
language:
- ru
- en
metrics:
- f1
pipeline_tag: token-classification
---

# Описание модели

Модель представляет собой дообученную версию [nielsr/lilt-xlm-roberta-base](https://huggingface.co/nielsr/lilt-xlm-roberta-base) для анализа документов, подтверждающих индивидуальные достижения, которая позволит автоматически извлекать важную информацию из отсканированных документов.  

Модель способна распознавать следующие классы:
* **Дата получения (DATE)** 
* **ФИО владельца (FULL_NAME)**
* **Тип документа (DOC_TYPE)**
* **Причина получения (REASON_OBTAINING)**
* **Место, которое занял владелец (PLACE)**

# Датасет
Датасет `PIAD` (Parsing Individual Ahievement Documents) включает в себя **215** отсканированных документов, подтверждающих индивидуальные достижения.
> [!NOTE]
> PIAD не выложен в открытый доступ, так как некоторые элементы содержат персональные данные.

# Ссылки
- **Разработчик:** [Agapitov Denis](https://github.com/koshkidadanet)
- **Репозиторий GitHub:** [lilt-finetuning-piad-ya-ocr](https://github.com/koshkidadanet/lilt-finetuning-piad-ya-ocr)
- **Дообученная версия модели:** [nielsr/lilt-xlm-roberta-base](https://huggingface.co/nielsr/lilt-xlm-roberta-base)