`pip install sentencepiece==0.1.97` | |
```python | |
import sentencepiece as spm | |
sample_text = "আইপিএম পদ্ধতি অনুসরণ করে এসব পোকামাকড় দমনের ব্যবস্থা নিতে হবে অথবা চিকিৎসকের পরামর্শ নিয়ে সহনীয় মাত্রায় কীটনাশক প্রয়োগ করতে হবে।" | |
tokenizer = spm.SentencePieceProcessor(model_file="spc_bpe_bn.model") | |
tokenizer.tokenize(sample_text, out_type=str) | |
``` | |
--- | |
license: afl-3.0 | |
language: | |
- bn | |
tags: | |
- sentencepiece | |
- bangla | |
- word | |
- tokenizer | |
--- |