File size: 1,338 Bytes
4ddb3dd
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
ebd05ce
4ddb3dd
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
ebd05ce
4ddb3dd
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
---
license: mit
language:
- tr
metrics:
- accuracy
- f1
pipeline_tag: token-classification
tags:
- ner
- turkish-ner
- turkish
- nlp
---

Bu model "https://github.com/stefan-it/turkish-bert" base alınarak geliştirilmiş bir NER(Varlık ismi tanıma) modelidir.


## Eğitim ve validasyon verisi

Fine-tune işlemi için TDD-NER-202112-CC-001 veri seti kullanılmıştır.

@article{tur-etal-2003-milliyet,
    title={A statistical information extraction system for Turkish}, 
    volume={9},
    DOI={10.1017/S135132490200284X},
    number={2},
    journal={Natural Language Engineering},
    publisher={Cambridge University Press},
    author={Tür, Gökhan and Hakkani-Tür, Dilek and Oflazer, Kemal},
    year={2003},
    pages={181–210}
}


### Hiperparametreler

custom_labels = ["O","B-LOC","I-LOC","B-ORG","I-ORG","B-PER","I-PER"]

model_args = {
    "train_batch_size": 32,
    "eval_batch_size": 32,
    "num_train_epochs": 3,
    "seed":1,
    "save_steps": 625,
    "overwrite_output_dir": True,
    "output_dir": "/content/Model"
}

### Nasıl Kullanılacağı

```
from transformers import pipeline

pipe = pipeline("token-classification", model="Gorengoz/bert-based-Turkish-NER")
pipe("Entity X'in müşteri hizmetleri hızlı ve etkili, Entity Y'nin ürün kalitesi çok kötü.",aggregation_strategy = "simple"")

```