truecase-tr-wiki / README.md
atasoglu's picture
add 'NER' to tags
ce2b0ed
metadata
license: mit
language:
  - tr
multilinguality:
  - monolingual
pretty_name: truecase-tr-wiki
tags:
  - feature-extraction
  - NER
  - truecase

Pretrained truecase model for Turkish case fix.

Trained on this Wiki corpus. Due to lack of RAM, only 40% of the corpus (more than 260K unique tokens) was used for training.

Example:

>>> from truecase import TrueCaser
>>> tc = TrueCaser('turkish.dist')
>>> tc.get_true_case("önemli iki nato üyesi ülke abd ve türkiye")
'Önemli iki NATO üyesi ülke ABD ve Türkiye'
>>> tc.get_true_case("ayşe, ahmet ve zeynep hep birlikte antalyaya tatile gitti")
'Ayşe, Ahmet ve Zeynep hep birlikte Antalyaya tatile gitti'
>>> tc.get_true_case("kurtuluş savaşı atatürkün samsuna çıkışıyla başladı")
'Kurtuluş Savaşı Atatürkün Samsuna çıkışıyla başladı'