truecase-tr-wiki / README.md
atasoglu's picture
add 'NER' to tags
ce2b0ed
---
license: mit
language:
- tr
multilinguality:
- monolingual
pretty_name: truecase-tr-wiki
tags:
- feature-extraction
- NER
- truecase
---
Pretrained [truecase](https://github.com/daltonfury42/truecase) model for Turkish case fix.
Trained on [this](https://dumps.wikimedia.org/trwiki/20230301/) Wiki corpus. Due to lack of RAM, only 40% of the corpus (more than 260K unique tokens) was used for training.
**Example:**
```console
>>> from truecase import TrueCaser
>>> tc = TrueCaser('turkish.dist')
>>> tc.get_true_case("önemli iki nato üyesi ülke abd ve türkiye")
'Önemli iki NATO üyesi ülke ABD ve Türkiye'
>>> tc.get_true_case("ayşe, ahmet ve zeynep hep birlikte antalyaya tatile gitti")
'Ayşe, Ahmet ve Zeynep hep birlikte Antalyaya tatile gitti'
>>> tc.get_true_case("kurtuluş savaşı atatürkün samsuna çıkışıyla başladı")
'Kurtuluş Savaşı Atatürkün Samsuna çıkışıyla başladı'
```