|
---
|
|
language:
|
|
- uk
|
|
tags:
|
|
- ukrainian
|
|
license: mit
|
|
---
|
|
## Model Description
|
|
Quantized version [uk-ner model](https://huggingface.co/ukr-models/uk-ner). Returns B-PER, I-PER, B-LOC, I-LOC, B-ORG, I-ORG tags
|
|
|
|
## How to Use
|
|
|
|
After cloning the repository, please use the following code (download script get_predictions.py from the repository, it uses [package tokenize_uk](https://pypi.org/project/tokenize_uk/) for splitting)
|
|
```py
|
|
from transformers import AutoTokenizer
|
|
import torch
|
|
from get_predictions import get_word_predictions
|
|
|
|
tokenizer = AutoTokenizer.from_pretrained("./")
|
|
model = torch.load("./pytorch_model.bin")
|
|
|
|
labels_list = ['O','B-PER','I-PER','B-ORG','I-ORG','B-LOC','I-LOC']
|
|
texts = ["Могила Тараса Шевченка — місце поховання видатного українського поета Тараса Шевченка в місті Канів (Черкаська область) на Чернечій горі, над яким із 1939 року височіє бронзовий пам'ятник роботи скульптора Матвія Манізера."]
|
|
get_word_predictions(model, tokenizer, texts, labels_list)
|
|
```
|
|
|