File size: 924 Bytes
c6fa84c 823d77b ce2b0ed 513ae97 c6fa84c 823d77b |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 |
---
license: mit
language:
- tr
multilinguality:
- monolingual
pretty_name: truecase-tr-wiki
tags:
- feature-extraction
- NER
- truecase
---
Pretrained [truecase](https://github.com/daltonfury42/truecase) model for Turkish case fix.
Trained on [this](https://dumps.wikimedia.org/trwiki/20230301/) Wiki corpus. Due to lack of RAM, only 40% of the corpus (more than 260K unique tokens) was used for training.
**Example:**
```console
>>> from truecase import TrueCaser
>>> tc = TrueCaser('turkish.dist')
>>> tc.get_true_case("önemli iki nato üyesi ülke abd ve türkiye")
'Önemli iki NATO üyesi ülke ABD ve Türkiye'
>>> tc.get_true_case("ayşe, ahmet ve zeynep hep birlikte antalyaya tatile gitti")
'Ayşe, Ahmet ve Zeynep hep birlikte Antalyaya tatile gitti'
>>> tc.get_true_case("kurtuluş savaşı atatürkün samsuna çıkışıyla başladı")
'Kurtuluş Savaşı Atatürkün Samsuna çıkışıyla başladı'
``` |