metadata
license: mit
language:
- tr
multilinguality:
- monolingual
pretty_name: truecase-tr-wiki
tags:
- feature-extraction
- NER
- truecase
Pretrained truecase model for Turkish case fix.
Trained on this Wiki corpus. Due to lack of RAM, only 40% of the corpus (more than 260K unique tokens) was used for training.
Example:
>>> from truecase import TrueCaser
>>> tc = TrueCaser('turkish.dist')
>>> tc.get_true_case("önemli iki nato üyesi ülke abd ve türkiye")
'Önemli iki NATO üyesi ülke ABD ve Türkiye'
>>> tc.get_true_case("ayşe, ahmet ve zeynep hep birlikte antalyaya tatile gitti")
'Ayşe, Ahmet ve Zeynep hep birlikte Antalyaya tatile gitti'
>>> tc.get_true_case("kurtuluş savaşı atatürkün samsuna çıkışıyla başladı")
'Kurtuluş Savaşı Atatürkün Samsuna çıkışıyla başladı'