cenkersisman
/

gpt2-turkish-900m

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

cenkersisman commited on Aug 15, 2023

Commit

d18969d

·

1 Parent(s): 2d648cd

Create README.md

Files changed (1) hide show

README.md +53 -0

README.md ADDED Viewed

	@@ -0,0 +1,53 @@

+---
+widget:
+- text: 'limon'
+  example_title: limon
+- text: 'kayseri'
+  example_title: kayseri
+- text: 'kanal d'
+  example_title: kanal d
+- text: 'sonunda'
+  example_title: sonunda
+- text: 'hayatın anlamı'
+  example_title: hayatın anlamı
+- text: 'sözcüklerin anlamsızlığı'
+  example_title: sözcüklerin anlamsızlığı
+language:
+- tr
+---
+# Model
+GPT-2 Türkçe Modeli
+### Model Açıklaması
+GPT-2 Türkçe Modeli, Türkçe diline özelleştirilmiş olan GPT-2 mimarisi temel alınarak oluşturulmuş bir dil modelidir. Belirli bir başlangıç metni temel alarak insana benzer metinler üretme yeteneğine sahiptir ve geniş bir Türkçe metin veri kümesi üzerinde eğitilmiştir.
+Modelin eğitimi için 900 milyon karakterli Vikipedi seti kullanılmıştır.
+Türkçe heceleme yapısına uygun tokenizer kullanılmış ve model 600 bin adımda 1 epoch eğitilmiştir.
+Eğitim için 4GB hafızası olan Nvidia Geforce RTX 3050 GPU kullanılmaktadır.
+## Model Nasıl Kullanılabilir
+```python
+# Model ile çıkarım yapmak için örnek kod
+from transformers import GPT2Tokenizer, GPT2LMHeadModel
+model_name = "cenkersisman/gpt2-turkish-900m"  # Change to the model name you have uploaded to Hugging Face
+tokenizer = GPT2Tokenizer.from_pretrained(model_name)
+model = GPT2LMHeadModel.from_pretrained(model_name)
+prompt = "okyanusun derinliklerinde bulunan"
+input_ids = tokenizer.encode(prompt, return_tensors="pt")
+output = model.generate(input_ids, max_length=100, pad_token_id=tokenizer.eos_token_id)
+generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
+print(generated_text)
+```
+## Sınırlamalar ve Önyargılar
+Bu model, bir özyineli dil modeli olarak eğitildi. Bu, temel işlevinin bir metin dizisi alıp bir sonraki belirteci tahmin etmek olduğu anlamına gelir. Dil modelleri bunun dışında birçok görev için yaygın olarak kullanılsa da, bu çalışmayla ilgili birçok bilinmeyen bulunmaktadır.
+Model, küfür, açık saçıklık ve aksi davranışlara yol açan metinleri içerdiği bilinen bir veri kümesi üzerinde eğitildi. Kullanım durumunuza bağlı olarak, bu model toplumsal olarak kabul edilemez metinler üretebilir.
+Tüm dil modellerinde olduğu gibi, bu modelin belirli bir girişe nasıl yanıt vereceğini önceden tahmin etmek zordur ve uyarı olmaksızın saldırgan içerik ortaya çıkabilir. Sonuçları yayınlamadan önce hem istenmeyen içeriği sansürlemek hem de sonuçların kalitesini iyileştirmek için insanların çıktıları denetlemesini veya filtrelemesi önerilir.