cenkersisman commited on
Commit
65d450d
1 Parent(s): 14b2705

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +12 -6
README.md CHANGED
@@ -15,16 +15,21 @@ widget:
15
  language:
16
  - tr
17
  ---
18
- # Model Card for Model ID
19
 
20
- Model Card for GPT-2 Turkish Model
21
- ### Model Description
22
 
23
- GPT-2 Turkish Model is a language model based on the GPT-2 architecture, fine-tuned for the Turkish language. It is capable of generating human-like text based on a given prompt and has been trained on a large corpus of Turkish text data.
 
 
 
 
 
 
 
24
 
25
- ## How to Get Started with the Model
26
  ```python
27
- # Example code for inference with the model
28
 
29
  from transformers import GPT2Tokenizer, GPT2LMHeadModel
30
 
@@ -39,6 +44,7 @@ generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
39
  print(generated_text)
40
 
41
  ```
 
42
  ## Sınırlamalar ve Önyargılar
43
  Bu model, bir özyineli dil modeli olarak eğitildi. Bu, temel işlevinin bir metin dizisi alıp bir sonraki belirteci tahmin etmek olduğu anlamına gelir. Dil modelleri bunun dışında birçok görev için yaygın olarak kullanılsa da, bu çalışmayla ilgili birçok bilinmeyen bulunmaktadır.
44
 
 
15
  language:
16
  - tr
17
  ---
18
+ # Model
19
 
20
+ GPT-2 Türkçe Modeli
 
21
 
22
+ ### Model Açıklaması
23
+
24
+ GPT-2 Türkçe Modeli, Türkçe diline özelleştirilmiş olan GPT-2 mimarisi temel alınarak oluşturulmuş bir dil modelidir. Belirli bir başlangıç metni temel alarak insana benzer metinler üretme yeteneğine sahiptir ve geniş bir Türkçe metin veri kümesi üzerinde eğitilmiştir.
25
+ Modelin eğitimi için 50 milyon karakterli Vikipedi seti kullanılmıştır.
26
+ Türkçe heceleme yapısına uygun tokenizer kullanılmış ve model 46 bin adımda 14 epoch eğitilmiştir.
27
+ Eğitim için 4GB hafızası olan Nvidia Geforce RTX 3050 GPU kullanılmaktadır.
28
+
29
+ ## Model Nasıl Kullanılabilir
30
 
 
31
  ```python
32
+ # Model ile çıkarım yapmak için örnek kod
33
 
34
  from transformers import GPT2Tokenizer, GPT2LMHeadModel
35
 
 
44
  print(generated_text)
45
 
46
  ```
47
+
48
  ## Sınırlamalar ve Önyargılar
49
  Bu model, bir özyineli dil modeli olarak eğitildi. Bu, temel işlevinin bir metin dizisi alıp bir sonraki belirteci tahmin etmek olduğu anlamına gelir. Dil modelleri bunun dışında birçok görev için yaygın olarak kullanılsa da, bu çalışmayla ilgili birçok bilinmeyen bulunmaktadır.
50