File size: 924 Bytes
c6fa84c
 
823d77b
 
 
 
 
 
 
ce2b0ed
513ae97
c6fa84c
823d77b
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
---
license: mit
language:
- tr
multilinguality:
- monolingual
pretty_name: truecase-tr-wiki
tags:
- feature-extraction
- NER
- truecase
---

Pretrained [truecase](https://github.com/daltonfury42/truecase) model for Turkish case fix.

Trained on [this](https://dumps.wikimedia.org/trwiki/20230301/) Wiki corpus. Due to lack of RAM, only 40% of the corpus (more than 260K unique tokens) was used for training.

**Example:**

```console
>>> from truecase import TrueCaser
>>> tc = TrueCaser('turkish.dist')
>>> tc.get_true_case("önemli iki nato üyesi ülke abd ve türkiye")
'Önemli iki NATO üyesi ülke ABD ve Türkiye'
>>> tc.get_true_case("ayşe, ahmet ve zeynep hep birlikte antalyaya tatile gitti")
'Ayşe, Ahmet ve Zeynep hep birlikte Antalyaya tatile gitti'
>>> tc.get_true_case("kurtuluş savaşı atatürkün samsuna çıkışıyla başladı")
'Kurtuluş Savaşı Atatürkün Samsuna çıkışıyla başladı'
```