cenkersisman
commited on
Commit
•
07a2ba1
1
Parent(s):
2a97e30
Update README.md
Browse files
README.md
CHANGED
@@ -27,7 +27,7 @@ GPT-2 Türkçe Modeli
|
|
27 |
|
28 |
GPT-2 Türkçe Modeli, Türkçe diline özelleştirilmiş olan GPT-2 mimarisi temel alınarak oluşturulmuş bir dil modelidir. Belirli bir başlangıç metni temel alarak insana benzer metinler üretme yeteneğine sahiptir ve geniş bir Türkçe metin veri kümesi üzerinde eğitilmiştir.
|
29 |
Modelin eğitimi için 900 milyon karakterli Vikipedi seti kullanılmıştır. Eğitim setindeki cümleler maksimum 48 tokendan (token = kelime kökü ve ekleri) oluşmuştur bu yüzden oluşturacağı cümlelerin boyu sınırlıdır..
|
30 |
-
Türkçe heceleme yapısına uygun tokenizer kullanılmış ve model 5 milyon adımda yaklaşık
|
31 |
Eğitim için 4GB hafızası olan Nvidia Geforce RTX 3050 GPU kullanılmaktadır.
|
32 |
|
33 |
## Model Nasıl Kullanılabilir
|
@@ -50,8 +50,9 @@ print(generated_text)
|
|
50 |
```
|
51 |
## Eğitim Süreci Eğrisi
|
52 |
|
53 |
-
![image/png](https://huggingface.co/cenkersisman/gpt2-turkish-900m/resolve/main/
|
54 |
|
|
|
55 |
## Sınırlamalar ve Önyargılar
|
56 |
Bu model, bir özyineli dil modeli olarak eğitildi. Bu, temel işlevinin bir metin dizisi alıp bir sonraki belirteci tahmin etmek olduğu anlamına gelir. Dil modelleri bunun dışında birçok görev için yaygın olarak kullanılsa da, bu çalışmayla ilgili birçok bilinmeyen bulunmaktadır.
|
57 |
|
|
|
27 |
|
28 |
GPT-2 Türkçe Modeli, Türkçe diline özelleştirilmiş olan GPT-2 mimarisi temel alınarak oluşturulmuş bir dil modelidir. Belirli bir başlangıç metni temel alarak insana benzer metinler üretme yeteneğine sahiptir ve geniş bir Türkçe metin veri kümesi üzerinde eğitilmiştir.
|
29 |
Modelin eğitimi için 900 milyon karakterli Vikipedi seti kullanılmıştır. Eğitim setindeki cümleler maksimum 48 tokendan (token = kelime kökü ve ekleri) oluşmuştur bu yüzden oluşturacağı cümlelerin boyu sınırlıdır..
|
30 |
+
Türkçe heceleme yapısına uygun tokenizer kullanılmış ve model 7.5 milyon adımda yaklaşık 12 epoch eğitilmiştir. Eğitim halen devam etmektedir.
|
31 |
Eğitim için 4GB hafızası olan Nvidia Geforce RTX 3050 GPU kullanılmaktadır.
|
32 |
|
33 |
## Model Nasıl Kullanılabilir
|
|
|
50 |
```
|
51 |
## Eğitim Süreci Eğrisi
|
52 |
|
53 |
+
![image/png](https://huggingface.co/cenkersisman/gpt2-turkish-900m/resolve/main/l3.png)
|
54 |
|
55 |
+
![image/png](https://huggingface.co/cenkersisman/gpt2-turkish-900m/resolve/main/l4.png)
|
56 |
## Sınırlamalar ve Önyargılar
|
57 |
Bu model, bir özyineli dil modeli olarak eğitildi. Bu, temel işlevinin bir metin dizisi alıp bir sonraki belirteci tahmin etmek olduğu anlamına gelir. Dil modelleri bunun dışında birçok görev için yaygın olarak kullanılsa da, bu çalışmayla ilgili birçok bilinmeyen bulunmaktadır.
|
58 |
|