|
--- |
|
license: mit |
|
language: |
|
- tr |
|
multilinguality: |
|
- monolingual |
|
pretty_name: truecase-tr-wiki |
|
tags: |
|
- feature-extraction |
|
- NER |
|
- truecase |
|
--- |
|
|
|
Pretrained [truecase](https://github.com/daltonfury42/truecase) model for Turkish case fix. |
|
|
|
Trained on [this](https://dumps.wikimedia.org/trwiki/20230301/) Wiki corpus. Due to lack of RAM, only 40% of the corpus (more than 260K unique tokens) was used for training. |
|
|
|
**Example:** |
|
|
|
```console |
|
>>> from truecase import TrueCaser |
|
>>> tc = TrueCaser('turkish.dist') |
|
>>> tc.get_true_case("önemli iki nato üyesi ülke abd ve türkiye") |
|
'Önemli iki NATO üyesi ülke ABD ve Türkiye' |
|
>>> tc.get_true_case("ayşe, ahmet ve zeynep hep birlikte antalyaya tatile gitti") |
|
'Ayşe, Ahmet ve Zeynep hep birlikte Antalyaya tatile gitti' |
|
>>> tc.get_true_case("kurtuluş savaşı atatürkün samsuna çıkışıyla başladı") |
|
'Kurtuluş Savaşı Atatürkün Samsuna çıkışıyla başladı' |
|
``` |