ebrukilic commited on
Commit
2c170bd
1 Parent(s): c9877de

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +105 -1
README.md CHANGED
@@ -14,4 +14,108 @@ tags:
14
  - nlp
15
  - sentiment
16
  - turkish
17
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
14
  - nlp
15
  - sentiment
16
  - turkish
17
+ ---
18
+ # Model Card for Model ID
19
+
20
+ <!-- Provide a quick summary of what the model is/does. -->
21
+
22
+ This modelcard aims to be a base template for new models. It has been generated using [this raw template](https://github.com/huggingface/huggingface_hub/blob/main/src/huggingface_hub/templates/modelcard_template.md?plain=1).
23
+
24
+ ## Model Details
25
+
26
+ ## Model Description
27
+
28
+ Bu model, Türkçe metinler üzerinde **Sentiment Analysis (Duygu Analizi)** yapmak için Türkçe dilindeki giyim ürünlerine ait metinlerden oluşturulan veri kümesi kullanılarak fine-tune edilmiş bir ABSA (Aspect-Based Sentiment Analysis) modelidir.
29
+ Model, `yeniguno/absa-turkish-bert-dbmdz` temel modelinden türetilmiştir ve Türkçe dilindeki metinlerde olumlu, olumsuz veya nötr duygu kategorilerine ait etiketleri tahmin edebilmektedir.
30
+
31
+
32
+ - **Developed by:** [@ebrukilic]
33
+ - **Model type:** [Fine-Tuned ABSA Model]
34
+ - **License:** [MIT]
35
+ - **Finetuned from model [optional]:** [yeniguno/absa-turkish-bert-dbmdz]
36
+
37
+ ### Direct Use
38
+
39
+ Bu model, doğrudan metin verisini alıp duygu etiketlerini tahmin etmek için kullanılabilir. Modelin çıktı olarak "olumlu", "olumsuz" veya "nötr" etiketlerinden birini döndürmesi beklenir.
40
+
41
+ ### Downstream Use
42
+
43
+ Bu model, duygu analizi yaparak müşteri yorumlarını analiz etmek veya sosyal medya üzerindeki duygusal eğilimleri izlemek gibi downstream uygulamalarda kullanılabilir.
44
+
45
+ ### Out-of-Scope Use
46
+
47
+ Model, sadece duygu analizi için eğitilmiştir. Karmaşık doğal dil işleme (NLP) görevleri, makale yazımı veya özetleme gibi işlemler için uygun değildir.
48
+
49
+ ## Bias, Risks, and Limitations
50
+
51
+ Bu modelin eğitildiği veri seti, belirli bir kullanıcı grubunun yorumlarından oluşmaktadır. Bu nedenle, modelin diğer kategorilere ait metinler üzerindeki duygu analizinde sınırlı bir performans gösterebilir.
52
+ Ayrıca, modelin etiketleri yalnızca belirli (olumlu, olumsuz, nötr) duygu kategorilerine odaklanmaktadır ve daha karmaşık duygu durumlarını ayırt etmekte zorlanabilir.
53
+
54
+ ## How to Get Started with the Model
55
+
56
+ Modeli, `transformers` kütüphanesini kullanarak yükleyebilir ve metinlerdeki duygu analizini gerçekleştirebilirsiniz.
57
+
58
+ ```python
59
+ from transformers import AutoModelForSequenceClassification, AutoTokenizer
60
+
61
+ # Model ve tokenizer yükleme
62
+ model_name = "ebrukilic/ara-proje-bert"
63
+ tokenizer = AutoTokenizer.from_pretrained(model_name)
64
+ model = AutoModelForSequenceClassification.from_pretrained(model_name)
65
+
66
+ # Model ve cihaz ayarı
67
+ device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
68
+ model.to(device)
69
+ model.eval()
70
+
71
+ # Test örneği
72
+ text = "Bu film harikaydı!"
73
+ inputs = tokenizer(text, return_tensors="pt", truncation=True, padding='max_length', max_length=128)
74
+ inputs = {key: value.to(device) for key, value in inputs.items()}
75
+
76
+ # Model tahmini
77
+ with torch.no_grad():
78
+ outputs = model(**inputs)
79
+
80
+ logits = outputs.logits
81
+ predicted_class_id = torch.argmax(logits, dim=-1).item()
82
+
83
+ # Etiketleri belirleme
84
+ id_to_label = {0: "negatif", 1: "nötr", 2: "pozitif"}
85
+ print(f"Predicted sentiment: {id_to_label[predicted_class_id]}")
86
+
87
+
88
+ ## Training Details
89
+
90
+ ## Eğitim Verisi
91
+
92
+ Model, Türkçe metinlerdeki kullanıcı yorumları ve ilgili "aspect"ler (özellikler) kullanılarak eğitildi. Etiketler, 3 sınıflı duygu (polarite) kategorisinde `negatif`, `nötr` ve `pozitif` olarak tanımlanmıştır. Eğitim verisi 10.000'den fazla örnekten oluşmaktadır.
93
+
94
+ Veri seti:
95
+ - **Normalized Yorum**: Yorum metni
96
+ - **Aspects**: Kullanıcı yorumu ile ilişkilendirilen konu veya özellik
97
+ - **Polarity**: Yorumun duygusal polaritesi (negatif, nötr, pozitif)
98
+
99
+ ### Testing Data, Factors & Metrics
100
+
101
+ #### Testing Data
102
+
103
+ <!-- This should link to a Dataset Card if possible. -->
104
+
105
+ [More Information Needed]
106
+
107
+ #### Factors
108
+
109
+ <!-- These are the things the evaluation is disaggregating by, e.g., subpopulations or domains. -->
110
+
111
+ [More Information Needed]
112
+
113
+ #### Metrics
114
+
115
+ Modelin performansını değerlendirmek için doğruluk (accuracy) ve F1 skoru gibi yaygın metrikler kullanılmıştır. Aşağıda modelin test verisi üzerinde elde edilen değerlendirme sonuçları yer almaktadır:
116
+
117
+ Doğruluk (Accuracy): 70.72%
118
+ F1 Skoru (Macro Average): 68.54%
119
+
120
+ Model, farklı sınıflara (pozitif, nötr, negatif) eşit ağırlık vererek (macro-average) değerlendirilmiştir. Bu metrikler, modelin sınıflandırma görevindeki genel başarısını yansıtmaktadır.
121
+