cenkersisman commited on
Commit
88e8403
1 Parent(s): fe93c6f

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +7 -2
README.md CHANGED
@@ -11,7 +11,12 @@ widget:
11
  - text: 'hayatın anlamı'
12
  example_title: hayatın anlamı
13
  - text: 'saint-joseph'
14
- example_title: saint-joseph
 
 
 
 
 
15
  language:
16
  - tr
17
  ---
@@ -23,7 +28,7 @@ GPT-2 Türkçe Modeli
23
 
24
  GPT-2 Türkçe Modeli, Türkçe diline özelleştirilmiş olan GPT-2 mimarisi temel alınarak oluşturulmuş bir dil modelidir. Belirli bir başlangıç metni temel alarak insana benzer metinler üretme yeteneğine sahiptir ve geniş bir Türkçe metin veri kümesi üzerinde eğitilmiştir.
25
  Modelin eğitimi için 900 milyon karakterli Vikipedi seti kullanılmıştır. Eğitim setindeki cümleler maksimum 48 tokendan (token = kelime kökü ve ekleri) oluşmuştur bu yüzden oluşturacağı cümlelerin boyu sınırlıdır..
26
- Türkçe heceleme yapısına uygun tokenizer kullanılmış ve model 3 milyon 480 bin adımda yaklaşık 6 epoch eğitilmiştir. Eğitim halen devam etmektedir.
27
  Eğitim için 4GB hafızası olan Nvidia Geforce RTX 3050 GPU kullanılmaktadır.
28
 
29
  ## Model Nasıl Kullanılabilir
 
11
  - text: 'hayatın anlamı'
12
  example_title: hayatın anlamı
13
  - text: 'saint-joseph'
14
+ example_title: saint-joseph
15
+ - text: 'türkiyenin en büyük şehirleri'
16
+ example_title: türkiyenin en büyük şehirleri
17
+ - text: 'tatlı olarak'
18
+ example_title: türkiyenin en büyük şehirleri
19
+
20
  language:
21
  - tr
22
  ---
 
28
 
29
  GPT-2 Türkçe Modeli, Türkçe diline özelleştirilmiş olan GPT-2 mimarisi temel alınarak oluşturulmuş bir dil modelidir. Belirli bir başlangıç metni temel alarak insana benzer metinler üretme yeteneğine sahiptir ve geniş bir Türkçe metin veri kümesi üzerinde eğitilmiştir.
30
  Modelin eğitimi için 900 milyon karakterli Vikipedi seti kullanılmıştır. Eğitim setindeki cümleler maksimum 48 tokendan (token = kelime kökü ve ekleri) oluşmuştur bu yüzden oluşturacağı cümlelerin boyu sınırlıdır..
31
+ Türkçe heceleme yapısına uygun tokenizer kullanılmış ve model 5 milyon adımda yaklaşık 8 epoch eğitilmiştir. Eğitim halen devam etmektedir.
32
  Eğitim için 4GB hafızası olan Nvidia Geforce RTX 3050 GPU kullanılmaktadır.
33
 
34
  ## Model Nasıl Kullanılabilir