File size: 648 Bytes
f500cf5 afdd7af |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 |
`pip install sentencepiece==0.1.97`
```python
import sentencepiece as spm
sample_text = "আইপিএম পদ্ধতি অনুসরণ করে এসব পোকামাকড় দমনের ব্যবস্থা নিতে হবে অথবা চিকিৎসকের পরামর্শ নিয়ে সহনীয় মাত্রায় কীটনাশক প্রয়োগ করতে হবে।"
tokenizer = spm.SentencePieceProcessor(model_file="spc_bpe_bn.model")
tokenizer.tokenize(sample_text, out_type=str)
```
---
license: afl-3.0
language:
- bn
tags:
- sentencepiece
- bangla
- word
- tokenizer
--- |